0

    百度文心大模型3.5版训练速度提升17倍

    10个月前 | admin | 74次围观

    6月26日,百度创始人、董事长兼首席执行官李彦宏出席“世界互联网大会数字文明尼山对话”,发表了题为《大模型重塑数字世界》的演讲。

    大模型是当下全球科技创新的焦点,也是全球人工智能竞赛的主战场。李彦宏认为,“新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用,这些应用在多大程度上提升了生产效率。如果我们能挤上牌桌,获得竞赛入场券,中国将拥有更壮大的数字化产业,数字经济规模将获得巨大增长。”

    李彦宏在演讲中还透露,百度文心大模型已经迭代到3.5版本。与3.0版本相比,训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%。“文心大模型3.5版本,不仅是技术上的升级,更是安全上的升级。”李彦宏强调,“在数据质量、生成效果和内容安全性上,都得到了明显提升。”

    李彦宏认为,以大模型为关键驱动的数字经济,与实体经济深度融合,将做强做优做大实体经济。汽车制造、能源、交通等行业,大模型可以深入核心业务场景,在智能客服、供应链、系统调度等版块创新,促进行业的数字化转型和智能化提升。

    人工智能大模型带来的治理挑战也不容忽视。李彦宏对此表示,“坚持技术发展和安全可控的双轮驱动,才能行稳致远。如果我们安全、负责任地驾驭AI发展之路,大模型就会重塑数字世界,人工智能就可以为中国经济、乃至全球经济创造无与伦比的繁荣,提高全人类福祉。”

    以下是演讲实录:

    尊敬的各位领导,各位嘉宾,大家上午好!

    很高兴参加世界互联网大会数字文明尼山对话,我演讲的主题是《大模型重塑数字世界》。

    过去一年,人工智能在技术、产品、应用等各个层面,都以“周”为迭代速度向前突进。大模型成功压缩了人类对于世界的认知,让我们看到了实现通用人工智能的路径。大模型发展的下一个前沿,不仅是模仿人类,完成人类的“规定动作”,更是帮助人类去研究和发现未知领域,突破人类过去没有突破过的极限。如果能够迈出去这一步,将更加意义非凡。

    大模型如何重塑数字世界?我想从技术和应用两个层面来谈谈:

    技术层面,人工智能时代,IT技术栈发生了根本性改变,从原来的芯片、操作系统和应用三层架构,变成了芯片、框架、模型、应用四层架构:

    底层是芯片层,主流芯片从CPU变成了GPU。芯片之上是框架层,主流框架包括百度飞桨,Meta的PyTorch,谷歌的TensorFlow。框架上面是模型层,ChatGPT和文心大模型就在模型层。大模型成为了人工智能时代的操作系统,所有应用都将基于大模型开发。模型之上是应用层,包括各种各样的AI原生应用。

    IT技术栈的结构性变化,意味着人工智能尤其是大模型技术,将重构全球数字化产业。新的国际竞争战略关键点不是一个国家有多少个大模型ai大模型日报,而是你的大模型上有多少原生的AI应用,这些个应用在多大程度上提升了生产效率。如果我们能挤上牌桌,获得竞赛入场券,中国将拥有更壮大的数字化产业,数字经济规模将获得巨大增长。

    百度投入人工智能已经超过10年了,在芯片、框架、模型、应用四层有全栈布局,在关键核心技术攻坚上,百度在四层架构都有自主研发的领先产品和技术,因此可以进行端到端的优化,迅速提升大模型训练和推理的效率。文心大模型是完全自主可控的ai大模型日报,我们做到了数据可控、框架可控、模型可控。

    当然,人工智能大模型带来的治理挑战也不容忽视。新技术应用往往先于规范,而建立健全保障人工智能健康发展的法律法规、制度体系、伦理道德,才能营造良好的创新生态。着眼未来,在重视防范风险的同时,也应同步建立容错、纠错机制,努力实现规范与发展的动态平衡。

    当下,大模型变得炙手可热。但在4年前,大模型还没被广泛关注的时候,百度就推出了文心大模型1.0。然后持续演进到2.0、3.0版本。

    今天,文心大模型已经迭代到3.5版本,与3月份的3.0版本相比,训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%。

    文心大模型3.5版本,不仅是技术上的升级,更是安全上的升级。我们采用业界主流的大模型基础能力评估方法开展评估,结果显示,文心大模型3.5版本,在数据质量、生成效果和内容安全性上,都得到了明显提升。

    我国人工智能大模型已具有一定基础,我们需要奋起直追。同时,应发挥应用场景优势,进一步深耕垂直领域,打造金融、医疗、电力等领域的专业大模型,以高质量应用和数据反馈实现技术优化,帮助大模型迭代升级,并建好AI生态。

    可以预见,大模型将渗透到越来越多的领域,以大模型为关键驱动的数字经济,与实体经济深度融合,将做强做优做大实体经济,创造可观的增量价值,带来经济社会发展和产业的深刻变革。

    比如在汽车制造行业,最复杂的设计环节,需要有经验丰富的工程师在2万多个零部件、几十万个参数里,找到满足需求的各种组合,再写文档、画图纸。在长安汽车,大模型可以高效地找到组合信息,自动生成设计文档,大幅缩减研发周期和成本。在中石化、南方电网,大模型可以深入核心业务场景,在智能客服、供应链、系统调度等版块创新,促进行业的数字化转型和智能化提升。

    在交通领域,通过大模型技术支持的智能交通方案,可以提升交通运行效率。

    比如,今年五一长假之前最后一个工作日,北京城市拥堵指数暴增2.5倍。从二环堵到六环,一片红,唯一绿的是亦庄。亦庄车流量同样明显增加,但因为部署了AI全域信控方案,300多个智能路口,都可以根据车流量自动调节红绿灯,亦庄成为不堵车的一片“绿洲”。在端午前一天,北京城区和亦庄的交通对比来看,惊人的相似:城区很堵,但亦庄畅通。

    在山东泰安泰山景区,为了服务旅游经济发展,推进城区疏堵保畅,解决外地游客“停车难”的痛点,百度利用交通诱导屏、绿波带等智能管控方式,有效保障了市民和游客的安全出行。

    百度智能交通解决方案已经被69个城市采用。通过智能调整红绿灯的时间,可以让通行效率提升15%-30%,这将拉动GDP2.4%-4.8%的增长。

    在山东济南,我们还落地了百度智能云(山东)人工智能基础数据产业基地,既培育了AI训练师这样的新职业,又孵化了22家数据标注科技企业,带动区域就业的同时,拉动了经济增长。

    无论从技术趋势,还是产业应用来看,大模型都绝不是昙花一现的风口,而是影响人类发展的重大技术变革,是拉动全球经济增长的引擎,是绝对不能错过的重大战略机遇。

    坚持技术发展和安全可控的双轮驱动,才能行稳致远。如果我们安全、负责任地驾驭AI发展之路,大模型就会重塑数字世界,人工智能就可以为中国经济、乃至全球经济创造无与伦比的繁荣,提高全人类福祉。

    我的发言就到这里,谢谢!

    发表评论