百度沈抖:大模型 产业智能化时代的新引擎( 三 )


第二是办公领域,我们和一些企业一起研发了新的功能,通过跟机器对话就可以生成PPT、合同、文档等 。基于诉求语言,在几分钟之内就可以生成一个条款清晰的合同初稿 。
还有营销领域,我们可以帮商家一键生成各种风格的营销方案,并且通过数字人实现7×24小时的直播带货 。
智慧政务领域,我们也在跟一些机构合作,测试城市智慧平台的交互功能,比如快到端午节了,我们可以直接问,端午节我们的客流量会怎么样?这时候它就会自动生成报表、分析,并且形成回答 。
另外一个领域,也是刚才大家提到的代码生成领域,百度智能云推出了基于文心大模型的代码助手“”,它可以结合上下文,预测程序员接下来想要输入的代码,还能用自然语言来写代码,并且自动查找代码中的错误 。在百度内部已经经过了长时间验证和迭代,目前生成代码的采用率达到50%,而且它作为一个插件已经在多个编程环境里面去实现,接下来我相信在不同的编程环境里都可以用到 。
大模型对我们影响之深,每个企业都在思考到底怎么参与到大模型浪潮里面去?无非是这么几种情况:
一,构建基础大模型的企业 。刚才我们讲到它需要大量的数据、算力,非常长期的经验积累 。所以这个大概率是少数企业才能做的事情 。
二,建立行业大模型 。行业大模型就是结合行业特有的数据、应用的需求,那些有行业数据、掌握了行业场景的人,就会在基础大模型之上建立自己的行业大模型,基于大模型微调适合行业特点的行业模型 。
三,也可能是规模最大的,它就是在基础大模型或者行业大模型之后开发AI应用程序,而这类企业最需要思考的是到底应该选哪些基础大模型、行业大模型,应该在这些大模型做什么样的工程?怎么来解决行业的特定问题?
既然说到怎么选择大模型,现在就要思考相应的标准,我们根据全球主流大模型的测试和观察,提出了这么三个考量的要素:
首先,要看这个大模型的通用性好不好,有没有解决我们手头的问题,它有没有比较强的泛化能力?
第二,要看这个大模型迭代的速度快不快,因为今天的大模型远远没有到成熟的时候,还需要不断的持续迭代,如果一个大模型缺乏持续迭代的能力,它在后续很难有强劲的动力 。

百度沈抖:大模型 产业智能化时代的新引擎

文章插图
第三,要看这个大模型周围的工具链是不是完整,不管是为了开发应用,还是迭代行业大模型,都需要有丰富的工具链,包括数据的采集、标注,怎么去做各种微调甚至是插件的机制等,因为只有这些工具链齐全,才能真正帮助我们把大模型用到极致 。
为了支撑大模型的产业落地,百度智能云推出了文心千帆大模型平台 。这个平台不只支持百度的文心一言,也支持大量的第三方大模型,而且提供了比较完整的工具链、开发环境和基础设施 。
在性能方面,我们也具备了全球领先的性能指标,通过这些优化技术,可以使得千卡并行加速比达到90%以上,训练场景资源利用率到70%以上 。所以我们再去训练一个大模型,就能发现它比原来没有做这些优化之前效率提升了100% 。而且在部署方式上,我们既支持公有云的部署,也支持私有化的部署,原因是不同企业有不同的要求,我们希望提供灵活的方式,让所有企业都用好大模型 。
大模型要持续的迭代,在百度内部,文心一言也在不断迭代,从发布到现在几个月时间,文心一言已经迭代了四次,推理的性能提高了10倍 。而且在一些特定的、高频的场景下,通过使用文心一言高性能的模式,叫“文心一言-Turbo”,我们可以把推理速度提高50倍 。只有这样,才能真正让大模型做产业化的落地 。