首 页 | 要 闻 | 财 经 | 科 技 | 理 财 | 社 会 | 教 育 | 房 产 | 汽 车 | 旅 游 | 娱 乐 | 健 康
家 居 | 女 性 | 创 业 | 食 品 | 文 化 | 维 权 | 商 讯 | 城 市 | 生 活 | 商 业 | 营 销 | 游 戏

当前位置 > 主页 > 财经 >
超长文本是AI大模型的能力突破口吗?
时间: 2024-03-26 11:27 来源:新浪科技
【字号 】 【RSS订阅】 【打印】 【关闭

  近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是主要突破口吗?大模型还将如何提升能力?

  在3月24日举行的2024全球开发者先锋大会(2024 GDC)大模型前沿论坛上,阿里通义、腾讯混元、稀宇科技MiniMax ABAB、商汤商量、书生·浦语五个大模型的技术负责人罕见“同框”, 共同探讨未来大模型的技术演进方向。

  超长上下文成国产大模型新竞逐焦点

  3月18日,月之暗面公司宣布Kimi智能助手启动200万字无损上下文内测。2023年10月,Kimi初次亮相时其处理能力还只有20万字。也就是说,Kimi只用了不到半年,就将上下文处理能力提升了一个数量级。

  月之暗面介绍称,大模型无损上下文长度的数量级提升,能进一步打开对AI应用场景的想象力,包括完整代码库的分析理解、可以自主帮人类完成多步骤复杂任务的智能体、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。

  消息发布后,Kimi访问量激增,一度无法正常使用。连日来,Kimi还带“红”一众A股“Kimi概念股”。以超长上下文处理能力为突破口,Kimi成为国内出现“百模大战”以来为数不多的“破圈者”。

  Kimi迅速走红后,阿里宣布“通义千问”将向所有人免费开放1000万字的长文档处理功能,可以帮助用户快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。360智脑也宣布正式内测500万字长文本处理功能,该功能将入驻360AI浏览器。

  事实上,从2023年下半年开始,大模型支持的上下文长度就快速增长,从早期GPT-3的2K(存储容量单位),到今年3月提升到1M。

  “更长的上下文意味着什么,是我们需要思考的。”上海人工智能实验室首席科学家林达华介绍说,2K的上下文能力支持日常聊天、知识问答、短文理解;32K支持拟人对话、长文分析、代码解释及编写;100K支持处理长报告及短篇小说、智能体长时间交互、简单的软件及网站构建;1M支持处理长篇小说、直接注入小型知识库、项目级代码分析与构建。

  长文本能力仍存局限性

  林达华认为,直接使用上下文面临两个基本问题:一是超长上下文的推理计算代价高昂;二是上下文本身对信息不会进行压缩,不能直接捕捉其中的深层知识和规律。

  上海人工智能实验室青年科学家陈恺认为,目前业内对于长文本的评测方式是“大海捞针”,也就是从超长文本中找出一个信息,很多模型在这样的测试中能做到接近100%的准确率。

  陈恺说:“但如果把模型换到更接近真实的使用场景里,需要模型找一些碎片化信息并把它们联系起来,模型的能力和准确率会大幅下降。这和其他模型的应用能力类似,业内要继续关注模型的泛化性和实际应用能力。”

  此外,业内也有声音质疑超长上下文的技术水平和价值。月之暗面方面称,公司为了实现更好的长窗口无损压缩性能,研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走“滑动窗口”“降采样”等技术捷径,攻克了很多底层技术难点。

  达观数据副总裁王文广接受上海证券报记者采访表示:“从创新点来看,Kimi显示出了其在无损阅读方面的巨大潜力,超长文本上下文的输入为内容创作和整理提供了技术基础。但从技术本身来说,这只是个噱头,既没有对模型能力提升带来什么帮助,本身也没什么难度。”

  达观数据是专注智能文本处理的国家级专精特新“小巨人”企业。2023年7月,达观数据对外发布“曹植”大语言模型应用公测版,“曹植”具有长文本、多语言、垂直化三大特点。

  王文广说:“从Kimi的走红来看,接下来‘百模大战’会更加喧嚣,很快会有大模型厂商推出具有千万字甚至上亿字处理能力的模型。未来,大模型领域可能还会出现有噱头、技术难度不高的宣传点。但真正的产业应用,还是要静下心来,一步一个脚印提升模型能力,一点一滴来解决产业上的问题。”

  五大模型“主创”共论技术演进方向

  除了上下文长度,国产大模型还有哪些能力提升路径?下一步如何更大限度地发挥“模”力?

  阿里通义算法负责人周畅认为,合成数据会在未来大模型训练中扮演更重要的角色。合成数据是一种模仿真实世界数据的非人工创建的数据。

  “通过使用合成数据,语言模型和多模态模型有望仅靠‘自己’便获得能力提升。升级数据处理能力将是提升模型研发水平的重要方向之一。”周畅说。

  对于如何让模型本身深度参与迭代,陈恺表示,参照研究人员研发中需具备的能力,如果模型具备较强的数学能力、编程能力和头脑风暴能力,并很好地将几种能力结合起来,就能向“自我提升”的临界点迈进。

  腾讯混元大模型算法负责人康战辉提到,目前,头部厂商的模型架构都在转向混合专家模型(Mixture of Experts,MoE)。混合专家模型即将大型模型拆分为多个较小的专家模型,每个专家模型负责处理特定的任务或数据子集。

  在康战辉看来,未来,参数量较小的模型可能在应用端表现出更高效率和“性价比”,全模态输入输出的大模型将是下一阶段研究目标。

  大模型的技术演进一方面旨在进一步提升能力,另一个重要方向是如何在现实场景中更好用。

  稀宇科技技术副总裁安德森认为,人完成各种各样的工作时,并不是仅靠自己的大脑,而是靠大脑加上各种外部的工具。所以,大模型在落地应用的时候也要考虑把大模型和其他工具,包括其他模型结合在一起,使其更加便利。

  商汤科技大装置执行总监成功表示,大模型的基础能力已在很多场景落地,但在实践中,模型的推理能力,包括规划执行能力等仍需重点突破。同时,他强调关注效率和成本,模型能以更低成本、更快触达应用始终是技术发展的重要目标。

【领先财经网-www.591news.com.cn
    超长,文本,是,大模型,的,能力,突破口,吗,近日,
    分享组件,请点击:
    推荐新闻:
    ·度小满发起“满分助跑计划”
    ·华为Mate 60 Pro上架即售罄!
    ·油价重挫 鹰派美联储令库存下降利好黯然失色
    ·循梦而行??专注敏感肌 ?薇诺娜的天花板是150亿 ?- 专访薇诺娜创始人郭振宇博士
    ·美股周一:三大股指涨跌不一,阿里巴巴跌近1%,拼多多跌3%
    ·韩国拟投2300亿美元,打造全球最大半导体产业集群
    ·美在线支付巨头PayPal计划裁员2000人
    ·官宣!OPPO新品发布会定档8月10日 易建联加入OPPO
    ·巴黎出租车司机起诉特斯拉:“自行加速”酿致命车祸
    ·贝莱德称全球央行加息可能雷声大雨点小
    新闻要闻>>
    ·三美现在最红的是她?
    ·她有机会成功上位吗?
    ·电动冲牙器的狂飙、迷茫和突破?
    ·郑氏姐妹的美丽思路:颅顶高不了一点
    ·不演古偶的她,这次赢了吗?
    ·她那么美,却又那么惨
    ·奚梦瑶和刘雯,超模的两条路
    ·吉祥汽车来了:首款车明年上市
    ·消息称iPhone 17系列屏幕有重大升级:“
    ·百度CIO李莹接任小度科技CEO
    ·韩国7月出生人口再创新低,连续45个月
    ·二季度全国婚姻登记数据
    ·冬天多吃莓果有助肌肤红润
    ·驴肉补益气血,走俏冬季餐桌
    ·夏季常吃三黎鱼可补虚益气
    热点财经 >>
    ·【一线调研·加快形成新质生产力】上
    ·AI营销公司奥创光年宣布获1500万美元
    ·三星或计划在两年内将部分Galaxy AI功能
    ·最高检检察长应勇有新职务
    ·迎战苹果Vision Pro 高通发布新款头显芯
    ·寒潮带旺取暖小家电销售,行业能否迎
    ·“木头姐”批评通用和福特放缓电动化
    ·社区食堂,进入“冰火两重天”
    ·被打假后,泰国“瑞幸”竟起诉瑞幸咖
    ·12月暨2024年度化工行业投资策略:布局
    ·不再兼容安卓!华为鸿蒙原生应用时代
    ·人形机器人将像智能手机一样无处不在
    ·DeepMind 的“非凡”新型人工智能出手了
    ·台积电第三季营收降幅低于预期 AI需求
    ·AI“上岗”,我的“饭碗”还稳吗?
    科技生活>> ;
    ·中国古代私家园林建筑的杰出代表 苏
    ·浪漫与现实的碰撞,爱情与面包的较量
    ·新华时评|传承“乒乓外交”精神,促
    ·教育部:将爱国主义教育纳入国民教育
    ·亿万富豪找回丢失25年儿子引热议,
    ·对话导演钱宁黄:环境一直变动 要为
    ·X掉蓝鸟,对标微信,马斯克收购Twit
    ·马斯克又吹牛?分析显示大广告客户并
    ·“千眼天珠”:能拍太阳打“喷嚏”的
    ·华尔街顶级分析师警告:美国人口老龄
    ·山东新增一所大学!
    ·微信 iOS 版 8.0.42 正式版支持多语言“
    ·办公之光?WPS AI已面向社会开放!
    ·蔚来推出电吸门升级服务 专为NT1平台
    ·机器人写作不过关,美国最大报业集团
    ·故宫博物院:9月1日起,开放入馆时间