【斯坦福】2023 AI 指数报告主要观点摘录

*****
01
报告主要内容 (1)研究开发
主要从人工智能论文(会议和期刊)和重要的机器学习系统数据方面分析了人工智能研发的趋势 。人工智能研究数量激增,自2010年以来,人工智能领域发表论文数量增加了1倍 。模式识别、机器学习、计算机视觉等领域是人工智能研究的重点 。
从2010年-2021年人工智能论文发表的数据来看,美国和中国跨国合作研究最多 。自2010年起,美国和中国的人工智能合作研究数量增加了4倍,是英国和中国人工智能合作研究数量(排名第二)的2.5倍 。但2020年到2021年,中美人工智能合作研究仅增加了2.1%,是2010年以来增长率最低的一年 。
图1 2010-2021年世界AI论文数量
图2 中美合作AI论文发表趋势图
中国发表人工智能论文数量最多 。美国人工智能会议论文和预印本论文引用数量仍然全球领先,但这一优势逐渐变小 。全球主要大语言模型和多模态模型仍然来自于美国机构,其中2022年美国占全球大语言模型和多模态模型比例为54% 。
图3部分大语言和多模态模型发布时间表和国家隶属关系
产业界开始领先学术界 。2014年以前,大多数影响力最大的机器学习模型都是学术界发布的 。2014年以后,产业界开始领先学术界 。2022年,产业界发布了32个重要的机器学习模型,而学术界只发布了3个 。目前大多数人工智能系统需要大量数据、算力和资源,而产业界在数据、算力、资源方面都远超学术界和非盈利机构 。
图4 2002-2022年按领域划分的重要机器学习系统数量
【【斯坦福】2023 AI 指数报告主要观点摘录】大语言模型变得更大,也更贵 。2019年发布的GPT-2是首个大语言模型,拥有15亿参数,训练成本约5万美元 。2022年发布的旗舰大语言模型PaLM具有5400亿参数,是GPT-2的360倍,训练成本约80亿美元,是GPT-2的160倍 。总的来看,大语言和多模态模型变得越来越大,也越来越贵 。
图5部分大语言模型和多模态模型的训练成本估算
(2)技术能力
报告分析了计算机视觉、语言、语音、增强学习和硬件领域的进展,并分析了人工智能的环境影响 。性能远超传统基准 。随着人工智能技术的发展,人工智能在许多领域的测试结果已远超传统性能基准 。而且模型性能达到传统性能基准的速度不断加快 。为此,出现了新的、综合性的基准套件,比如BIG-bench和HELM 。
图6 人工智能指数技术性能基准随时间推移的改进
生成式AI进入公众视野 。2022年发布了许多生成式AI模型,比如DALL-E 2、 这样的文本转图像模型、Make-A-Video这样的文本转视频系统、以及这样的聊天机器人 。但这些系统仍然不成熟,可能会生成错误的结果,因此难以用于重要领域 。
图7生成式AI根据文本生成图像
人工智能系统变得更加灵活 。传统人工智能系统只在具体的小范围任务中取得较好的效果 。近期发布的新模型正在转变这一趋势,BEiT-3、PaLI、Gato等单一人工智能系统都可以完成多个任务,比如视觉任务和语言任务 。
图8BEiT-3与以前最先进的模型对比
语言模型尝试进行推理 。语言模型不断改进其生成能力,最新研究表明语言模型正在尝试解决复杂的规划任务 。
图9部分大语言模型解决复杂规划任务的性能
人工智能给环境带来的影响喜忧参半 。最新研究表明,人工智能系统会对环境带来严重的影响 。BLOOM的训练过程排放的温室气体是美国纽约到旧金山单程飞机旅行的25倍 。同时,研究表明等增强学习模型可以用于优化能源的利用 。
图10部分大语言模型和现实生活场景CO2排放对比