国内AI大模型综述：ChaGPT取得突破性进展，国内大模型争相发布中国之最oxox _中国之最oxoxtt

（报告出品方/作者：国信证券，谢琦，陈淑媛，王颖婕）
大模型概述：大模型提升机器理解能力，优化人机交互AI大模型是实现通用人工智能（AGI）的重要方向
AI 大模型是实现通用人工智能（AGI）的重要方向。AI 大模型是基于海量多源数据打造的模型。AI 大模型具备通用、可规模化复制等诸多优势，是实现 AGI（通用人工智能）的重要方向。AI 大模型当前包含自然语言处理(NLP)、计算机视觉（CV）等，统一整合的多模态大模型等。ChatGPT 推出两个月 MAU 突破 1 亿，是自然语言处理领域突破性的创新，进一步理解了人类语言。大语言模型（Large Language Model ， LLM）是一种使用了大量数据训练的深度学习算法，构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT 在 2022 年 11 月底推出后， 2023 年 1 月的月活跃用户数已达 1 亿，成为历史上用户增长最快的应用。ChatGPT 的自然语言处理能力超越了以往的自然语言处理模型，可以应对各种自然语言处理任务，包括机器翻译、问答、文本生成等。
ChatGPT 由 OpenAI 研发， GPT 模型已更新至 GPT-4 ，大力出奇迹后出现涌现能力。GPT 全称是 Generative Pre-trained Transformer ，是 OpenAI 开发的一系列延伸自转换器架构（Transformer）的自然语言生成模型。2018 年， OpenAI 推出 GPT-1 。2022 年 11 月， OpenAI 推出了对话交互式的 ChatGPT 。ChatGPT 在 GPT-3.5 之上用基于人类反馈的监督学习和强化学习(RLHF)进行微调。人类反馈的引入，使机器更理解人类语言, 让 GPT 获得更逼真的结果。ChatGPT 在逻辑推理、上下文理解等方面的能力，是模型规模达到量级后“涌现”出的。
大模型应用：“预训练精调”即可对下游应用赋能，优化人类与机器交互方式
大模型借助“预训练精调”等模式，用相比较大模型更少量的数据即可对下游应用赋能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下，借助“预训练精调”等模式，应用模型用相比较大模型更少量的数据即可进行相应微调，高水平完成细分应用的任务。
大模型增强机器理解力，优化人类与机器交互方式，提升信息处理效率。1）自然语言类大模型：人类可以用自然语言方式，与机器形成交互。ChatGPT 为自然语言方面的大模型应用，语言文本处理是人类世界最重要的工作内容之一，如果 AI 能够懂的人类自然语言，并与人类形成交互，将协助人类大幅提升语言文本处理效率，带来生产力效率提升。例如， ChatGPT 可以依托人类自然问答的方式，帮助人类完成回答问题、虚拟助手（计划旅行、预定餐厅、购买产品等）、创作、文本、编程、摘要等工作。
我们也可以通过语言类大模型调用机器工具，大模型相当于人类助手。根据微软论文《Sparks of Artificial General Intelligence: Early experiments with GPT-4》， GPT-4 能够根据人类指令推断出需要哪些工具，有效地解析这些工具的输出并适当地做出回应，而无需任何专门的训练或微调。2023 年 3 月 23 日， OpenAI 宣布推出插件功能，帮助 ChatGPT 访问最新信息、进行计算或使用第三方服务。据 OpenAI 官网，第一批支持 ChatGPT 第三方插件的网站共 11 个，包含电商、预定航班、订购食材、检索实时信息、检索知识库信息等领域。

国内AI大模型综述：ChaGPT取得突破性进展，国内大模型争相发布 中国之最oxox

国内AI大模型综述：ChaGPT取得突破性进展，国内大模型争相发布中国之最oxox