国内AI大模型综述:ChaGPT取得突破性进展,国内大模型争相发布 中国之最oxox

(报告出品方/作者:国信证券 , 谢琦 , 陈淑媛 , 王颖婕)
大模型概述:大模型提升机器理解能力 , 优化人机交互AI大模型是实现通用人工智能(AGI)的重要方向
AI 大模型是实现通用人工智能(AGI)的重要方向 。AI 大模型是基于海量多源数据打 造的模型 。AI 大模型具备通用、可规模化复制等诸多优势 , 是实现 AGI(通用人工智 能)的重要方向 。AI 大模型当前包含自然语言处理(NLP)、计算机视觉(CV)等 , 统 一整合的多模态大模型等 。ChatGPT 推出两个月 MAU 突破 1 亿 , 是自然语言处理领域突破性的创新 , 进一步理解 了人类语言 。大语言模型(Large Language Model , LLM)是一种使用了大量数据训练 的深度学习算法 , 构建出一个能够理解人类语言并自动生成语言的模型 。ChatGPT 在 2022 年 11 月底推出后 , 2023 年 1 月的月活跃用户数已达 1 亿 , 成为历史上用户增长 最快的应用 。ChatGPT 的自然语言处理能力超越了以往的自然语言处理模型 , 可以应 对各种自然语言处理任务 , 包括机器翻译、问答、文本生成等 。
ChatGPT 由 OpenAI 研发 , GPT 模型已更新至 GPT-4 , 大力出奇迹后出现涌现能力 。GPT 全称是 Generative Pre-trained Transformer , 是 OpenAI 开发的一系列延伸自转换 器架构(Transformer)的自然语言生成模型 。2018 年 ,  OpenAI 推出 GPT-1 。2022 年 11 月 , OpenAI 推出了对话交互式的 ChatGPT 。ChatGPT 在 GPT-3.5 之上用基于人类反 馈的监督学习和强化学习(RLHF)进行微调 。人类反馈的引入 , 使机器更理解人类语言, 让 GPT 获得更逼真的结果 。ChatGPT 在逻辑推理、上下文理解等方面的能力 , 是模型 规模达到量级后“涌现”出的 。
大模型应用:“预训练 精调”即可对下游应用赋能 , 优化人类与机器交互方式
大模型借助“预训练 精调”等模式 , 用相比较大模型更少量的数据即可对下游应用赋 能 。预训练大模型基于海量数据的完成了“通识”教育 。在具体应用场景下 , 借助“预 训练 精调”等模式 , 应用模型用相比较大模型更少量的数据即可进行相应微调 , 高水 平完成细分应用的任务 。
大模型增强机器理解力 , 优化人类与机器交互方式 , 提升信息处理效率 。1)自然语言类大模型:人类可以用自然语言方式 , 与机器形成交互 。ChatGPT 为自然 语言方面的大模型应用 , 语言文本处理是人类世界最重要的工作内容之一 , 如果 AI 能够懂的人类自然语言 , 并与人类形成交互 , 将协助人类大幅提升语言文本处理效率 ,  带来生产力效率提升 。例如 , ChatGPT 可以依托人类自然问答的方式 , 帮助人类完成 回答问题、虚拟助手(计划旅行、预定餐厅、购买产品等)、创作、文本、编程、摘 要等工作 。
我们也可以通过语言类大模型调用机器工具 , 大模型相当于人类助手 。根据微软论文 《Sparks of Artificial General Intelligence: Early experiments with GPT-4》 ,  GPT-4 能够根据人类指令推断出需要哪些工具 , 有效地解析这些工具的输出并适当地 做出回应 , 而无需任何专门的训练或微调 。2023 年 3 月 23 日 , OpenAI 宣布推出插件 功能 , 帮助 ChatGPT 访问最新信息、进行计算或使用第三方服务 。据 OpenAI 官网 , 第 一批支持 ChatGPT 第三方插件的网站共 11 个 , 包含电商、预定航班、订购食材、检索 实时信息、检索知识库信息等领域 。