百度沈抖:大模型 产业智能化时代的新引擎

6月9日,2023 领航者峰会在杭州举办,聚焦数字经济新政策、新技术、新业态带来的蓬勃机遇,探讨ICT行业在AIGC时代将要面临的全新挑战与应对策略 。百度集团执行副总裁、百度智能云事业群总裁沈抖出席大会并做题为《大模型 产业智能化时代的新引擎》的分享 。
沈抖表示,未来所有的企业都会强依赖大模型,而且所有的产品都会基于大模型来开发 。现在我们就得做好重构产品和服务的准备:第一,要布局新的基础设施;第二,要构建AI原生的思维;第三,要持续迭代、反复验证 。
百度集团执行副总裁、百度智能云事业群总裁沈抖
以下是沈抖演讲实录:
大家好,我是沈抖,来自百度 。
我想大家刚才都注意到了,今天大会的主题是“精耕务实,为时代赋智慧” 。“精耕务实”是一种态度,“为时代赋智慧”是一个目标 。我们心中有了态度,眼中有了目标,接下来要解决的问题就是,我们有什么样的东西可以帮助达成这个目标?站在2023年,我相信大家都有了答案,那就是大模型,这也正是我今天跟大家分享的主题 。
为什么现在学术界、产业界、投资界都对大模型这么热衷,因为大家都明白大模型背后意味着两件事:
第一,大模型重新定义了人机交互 。在过去几十年,人机交互发生过三次大的变化:我记得我还在读书的时候,命令行是主要的工作界面 。我输入命令,它给我反应,当时觉得效率很高,但估计现在没有人会了,因为太复杂,门槛太高 。后来的图形界面更简单直观,我们用鼠标一层一层点击菜单,但是我相信大家都有这样的经历,当我们用一些软件的时候,很多长尾的功能就藏在一层一层的菜单里面,很难发现 。而现在大模型的出现,让我们可以用自然语言去跟计算机进行交互 。比如我现在在工作中经常会问:百度智能云的产品哪些毛利率超过了疫情前?以前我需要同事帮我准备半天,收集这样的问题 。但现在因为机器能够理解我的语言,几秒钟就可以出答案 。
所以每一次人机交互的变化,都会带来非常深远的影响,不仅创造了便利,更重要的是创造了很多机会,所以以后我们跟机器之间的交互,就是用语言来表达我们的需求,机器来理解我们的需求,来生成内容,来调用工具,为我们服务 。
第二是在宏观层面,大模型的出现意味着一种新的生产力正在诞生 。18世纪80年代以前,世界人均GDP的水平一直趴在地上,一直没有什么变化 。就像刚才几位嘉宾,包括张维迎教授(北京大学国家发展研究院博雅特聘教授、北大市场网络经济研究中心主任)提到的,世界人均GDP就是在工业革命开始以后,才出现了指数级的增长,而这种GDP的增长和技术之间的强相关性,也正好验证了我们熟悉的一段话,那就是“科技是第一生产力” 。
我们深入来看,这几次科技革命又不尽相同 。第一次蒸汽机革命和第二次电力革命,很大程度上解放了我们的体力;第三次信息革命,很大程度上在辅助我们的脑力,但这时候它还是一个工具;今天以为代表的生成式AI代表了更高阶的能力,实际上是部分的替代我们的脑力 。正是这种原因,现在它会从根本上去改变我们原来做的很多事情,会改变很多行业的格局 。
但是要想做出这样的大模型其实并不容易,刚才于英涛总(紫光股份董事长、新华三集团总裁兼首席执行官)也反复提到,我们需要数据、算力、算法等 。确实,数据、算力、学习机制,是我们做成的必备要素 。
>>首先是大数据,就像人生下来不是全知全能一样,我们也要天天学习,看很多的东西 。而一个上千亿参数的大模型,我们要想教会它,需要的数据规模会更大 。我们需要它去了解唐诗、新闻、论文、代码库等,这个数据相当于100万人一生的阅读量 。而且这里面只是有数据的规模还不够,还得有数据的质量 。像Open AI在论文里面就提到,他们雇佣了大量专业的人来标数据,而这些标注人员37%以上都是硕士生,充分说明了数据的重要性 。