首 页 | 要 闻 | 财 经 | 科 技 | 理 财 | 社 会 | 教 育 | 房 产 | 汽 车 | 旅 游 | 娱 乐 | 健 康
家 居 | 女 性 | 创 业 | 食 品 | 文 化 | 维 权 | 商 讯 | 城 市 | 生 活 | 商 业 | 营 销 | 游 戏

当前位置 > 主页 > 科技 >
百度文心大模型4.0即将发布,万卡训练史上最大参数模型
时间: 2023-10-11 09:58 来源:新浪证券
【字号 】 【RSS订阅】 【打印】 【关闭

  近日,有媒体报道称,百度正加紧训练文心大模型4.0,这将是文心大模型3.5版本后又一个重磅版本。据报道,文心大模型4.0进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆核心能力都将提升,特别是在逻辑推理、代码和数学等方面提升最明显。

  10月10日,记者从百度内部人士基本确认了该消息,据悉,即将推出的文心大模型4.0的参数量、训练数据量以及推理成本等都比3.5高出一个数量级。

  今年3月16日,百度官宣新一代大语言模型“文心一言”启动邀测,8月31日正式面向公众开放服务。如今,文心大模型即将再度升级发布4.0版,如此迅速的大模型升级速度,在国内尚属唯一。只不过,快速升级的背后,文心大模型4.0快速攀升的参数量、数据量所带来的训练和推理成本提升,也正在成为大模型商业化过程中需要考虑的重点。

  据此前消息报道,相比文心大模型3.5,文心4.0不仅训练成本在增加,推理成本也增加了很多,大概是此前的8-10倍。一直以来,百度并未对外披露大模型训练、推理的各项成本,不过据国盛证券此前估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM模型(如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM),训练成本介于200万美元至1200万美元之间。作为国内大语言模型代表,文心一言想要在性能上追赶甚至超越ChatGPT等国外同行,所需耗费的资金成本,恐怕也将与之相当。

  过高的训练和推理成本压力下,在打造领先的底层基础大模型的路上,注定只能是一场巨头间的游戏。不过对于百度而言,由于具备万卡集群、飞桨、文心大模型以及丰富的百度应用生态优势,独具芯片、框架、模型及应用四层架构优势,更具技术竞争力。

  在进一步降低大模型算力成本和时间成本上,百度万卡集群的整体优势已得到充分体现——在万卡集群训练大模型时,常规方法下工程师们有30%-40%时间都花在容错和故障恢复上,而在百度智能云自研的集群组网故障管理机制下,模型有效训练时间达到95%以上,人力及算力资源均得到了利用。

  真金白银投入的背后,目前国外大模型厂商已开始尝试收费模式,无论是在面向企业客户的B端垂类大模型开发,还是面向消费群体的To C付费产品,均有不少案例。例如,在面向C端消费者付费领域,目前GPT-4已推出“每月支付20美元订阅费”的收费模式。

  可以预见,不远的将来,以百度为代表的大模型企业们,或将陆续推出收费模式。在To C大模型AI应用层面,类似爱奇艺或百度网盘VIP会员的收费模式,也将不断浮现,逐渐培养用户付费习惯。

【领先财经网-www.591news.com.cn
    百度,文心,大模型,4.0,即将,发布,万卡,训练,
    分享组件,请点击:
    推荐新闻:
    ·市场分析公司Sensor Tower宣布裁员
    ·WPS AI正式面向社会开放 率先应用在WPS智能文档
    ·华为严打App互相拉起!不整改者直接下线、上报工信部
    ·理想汽车发布纯电解决方案
    ·互联网医疗股集体飙升 叮当健康涨逾25%平安好医生涨超7%
    ·余承东自曝折叠屏新旗舰X3
    ·谷歌母公司Alphabet旗下Wing计划组建无人机送货网络
    ·国美承认部分地区发货退款不及时,称正加快推进内部流程
    ·亚马逊计划关闭三家英国仓库 1200员工受影响
    ·三星Galaxy A04e手机发布:预计采用联发科Helio G35芯片
    新闻要闻>>
    ·消息称iPhone 17系列屏幕有重大升级:“
    ·百度CIO李莹接任小度科技CEO
    ·韩国7月出生人口再创新低,连续45个月
    ·二季度全国婚姻登记数据
    ·冬天多吃莓果有助肌肤红润
    ·驴肉补益气血,走俏冬季餐桌
    ·夏季常吃三黎鱼可补虚益气
    ·经常吃鱼皮肤不易被晒伤
    ·肌肤无华败火小零食蜂蜜
    ·准妈妈也可以重口味 但这五种食物最
    ·这种水果吃起来酸甜,但却是“隐形糖
    ·北京:学员7日内未参加培训可无条件
    ·女性在夏季吃胡萝卜的好处
    ·“高龄产妇”比例十年翻一番 背后原
    ·怎么给皮肤补水呢?
    热点财经 >>
    ·DeepMind 的“非凡”新型人工智能出手了
    ·台积电第三季营收降幅低于预期 AI需求
    ·AI“上岗”,我的“饭碗”还稳吗?
    ·蔚来首款智能手机将于9月21日发布
    ·王腾回归小米总部!
    ·快手电商宣布降低商家入驻门槛,推
    ·菜市场里的七夕情蔬 美菱品牌营销再
    ·液冷新时代 智算大有为 浩云长盛液冷
    ·用友网络董事长王文京:数智化转型已
    ·十个人=亚马逊,全球前十大富豪总财
    ·必须支持?鸿蒙系统不兼容安卓应用
    ·丰田第一财季营业利润1.1万亿日元,创
    ·快手快聘将投入1000亿流量,助力3亿人
    ·Grid Coffee:2023年预计将新增30-50家门店
    ·iPhone 15系列据称续航时间提升至多15
    科技生活>> ;
    ·“千眼天珠”:能拍太阳打“喷嚏”的
    ·华尔街顶级分析师警告:美国人口老龄
    ·山东新增一所大学!
    ·微信 iOS 版 8.0.42 正式版支持多语言“
    ·办公之光?WPS AI已面向社会开放!
    ·蔚来推出电吸门升级服务 专为NT1平台
    ·机器人写作不过关,美国最大报业集团
    ·故宫博物院:9月1日起,开放入馆时间
    ·Adobe联创去世,没他就没有PDF,乔布斯
    ·贝莱德前首席策略师称放弃衰退预测为
    ·餐饮股今日走强 呷哺呷哺及九毛九均
    ·吃宵夜会影响人的记忆力?你还敢吃宵
    ·AI让工作更轻松?
    ·加快推动制定《未成年人网络保护条例
    ·马斯克限制推特浏览量致平台搜索曝光
    ·金山办公与NVIDA团队合作,加速WPS AI落