国内AI大模型综述:ChaGPT取得突破性进展,国内大模型争相发布 中国之最oxox( 四 )


百度 NLP 核心是 ERNIE 模型 。文心 NLP 大模型面向语言理解、语言生成等 NLP 场景 。百度文心 NLP 大模型打造了 ERNIE 模型系列 , ERNIE 问世于 2019 年 , 目前 发展至 3.0 版本 。其中语言理解和生成包含 ERNIE 3.0 Tiny、ERNIE 3.0 、鹏城 -百度.文心、ERNIE 3.0 Zeus , 另外文心 NLP 大模型包含医疗、金融等细分领域 ERNIE 模型 。ERNIE 3.0 Tiny(轻量级):可用于通用语言理解 。ERNIE 3.0(百亿级):可用于智能创作、摘要生成、问答、语义检索、情感 分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务 。鹏城-百度·文心(千亿级):模型参数规模达到 2600 亿(GPT-3 1750 亿), 可用于舆情分析、智能创作、文本解析等 。
文心大模型在国内市场格局中较为领先 。根据 IDC 发布《2022 中国大模型发展白 皮书》 , 百度文心大模型在市场格局中在产品能力、生态能力、应用能力等方面 在国内较为领先 。文心一言核心优势是对中文的理解 。百度作为中国语境的搜索龙头 , 拥有有更多 的中文语料数据参与训练 。比如 , 文心一言可以针对“洛阳纸贵”这种容易产生 歧义的成语 , 给出较为贴切的解释 。可以用成语写出藏头诗 , 用四川话读出文章 。
模型toC应用:文心一言有望优化C端用户搜索、创作体验
百度已经推出对话式产品文心一言 。文心一言可通过对话模式 , 帮助用户文学创 作、商业文案创作、数理推算、中文理解、多模态生成等 。例如文心一言发布会 上案例 , 文心一言可以生成 2023 世界智能交通大会海报 , 解答“智能交通最适合
模型toB应用:开放 API 接口赋能企业 , 精调行业模型 目前 , 百度开放大模型 API 接口 , 在文案、AI作画、开放域对话方面赋能开发者 和企业 。百度文心大模型开放了 NLP 大模型 ERNIE3.0、ERNIE-ViLG 文生图、对话 大模型 PLATO 。ERNIE 3.0 提供文案改写、开放问答、摘要、文案创作、小说创作、文本补 全等文本理解与创作能力 。ERNIE-ViLG 提供基于文本描述的 AI 作画能力 。PLATO提供生成式开放域对话服务 , 逻辑清晰、知识多元、情感丰富 , 闲聊 能力接近真人水平 。当前已经有 650家企业宣布接入文心一言生态 , 还有更多的企业在排队 。据百度 介绍 , 申请文心一言 API调用服务测试的企业已突破 6.5 万 。
对于具体行业来说 , 百度也推出文心.行业大模型 , 进行行业精调 。行业大模型 是在百度通用大模型的基础上学习行业特色数据与知识 , 建设行业 AI 基础设施 。
百度文心行业大模型以“行业知识增强”为核心特色 。目前百度文心行业大模型 在能源、金融、航天、制造、传媒、城市、社科以及影视等领域 , 与国网、浦发、 吉利、TCL、人民网、上海辞书出版社等均有案例应用 。我们以五个行业场景举例: 在燃气行业 , “深燃-百度·文心”在环境巡检、安全监控等领域落地 , 有效 解决了场景繁杂、识别困难等难题; 在汽车行业 , “吉利-百度·文心”应用于售后服务和汽?领域知识库构建等 场景; 在保险行业 , “泰康-百度·文心”应用于医疗单据识别等任务 , 平均字段识 别错误率相对下降;在电子制造行业 , “TCL-百度·文心”改变了传统质检算法流程 , 大幅提升 了模型研发与运营效率 , 实现降本增效;在社科行业 , “辞海-百度·文心”用于版权保护、词条管理和知识挖掘等方 面 。