国内AI大模型综述:ChaGPT取得突破性进展,国内大模型争相发布 中国之最oxox( 七 )


模型性能优异 , NLP 大模型是首个千亿参数级中文大模型 , 2021 年位列 CLUE 榜 单三项第一 。2021 年 4 月华为云盘古 NLP 大模型发布 , 这是当时业界首个 2000 亿参数的中文预训练模型 。在 2021 年 , 盘古 NLP 模型在中文语言理解评测基准 CLUE 榜单中总排行榜及分类、阅读理解单项均排名第一 , 刷新了三项榜单世界历 史纪录 。盘古 CV 大模型是业界最大的 CV 预训练模型 。盘古 CV 大模型包含了 30 多亿参数 和 10 亿级别的图像 , 已经在 100 多个场景中得到了验证 。在 Image Net 1%、10% 数据集上的小样本分类精度上均达到业界最高水平 。
模型应用:在物流、药物研发、气象等多个场景实现落地 , 极大提高行业效率
NLP 大模型、CV 大模型等都是华为 L0 级别的基础大模型 , 往上则是 L1 级别的行 业大模型和 L2 级别的细分场景模型 。具体而言 , 盘古 CV 大模型目前覆盖了工业质检、物流仓库监控、时尚辅助设计等 行业和领域;盘古 NLP 大模型覆盖了智能文档检索、智能 ERP 和小语种大模型; 盘古科学计算大模型则应用于气象预报、海浪预测等方面 。
物流仓库监控:在物流场景 , 华为盘古团队为浦发银行构建了“物的银行”—— 普慧云仓 。相比于传统的数字银行 , 它能够更彻底的做到业务流程的线上化 , 进 一步提升效率 。华为数据显示 , 在人员行为、货物检测方面 , “物的银行”可以 实现 5%到 10%的性能提升 。新药研发:传统模式下 , 新药研发有周期长、投入大、成功率高的难题 , 盘古药 物分子大模型是专门面向药物研发领域推出的模型 , 可以帮助医药公司进行 AI 辅助研发 , 使得先导药研发周期从数年缩短到 1 个月 , 极大改善了新药研发过程 的效率 。
气象预测:盘古气象大模型的研究团队通过 3D Earth-Specific Transformer 的 方式处理复杂的不均匀 3D 气象数据 , 提高 AI 大模型的预测精度 。盘古气象大模 型能够提供秒级的全球气象预报 , 其气象预测结果包括位势、湿度、风速等 , 其 精度首次超过了欧洲气象中心的数字分析的方法 , 并且预测速度提升了 1 万倍以 上 。
字节跳动大模型模型简述:AI探索基础扎实 , 语言大模型和图像大模型初步布局
字节跳动 AIGC 大模型将从语言和图像两种模态发力 。根据 36 氪消息 , 字节跳动在大模型上已有所布局 , 分别在语言和图像两种模态上发力 , 预期是在今年年中 推出大模型 。字节跳动 AIGC 大模型尚在初期探索阶段 , 有一定 AI 基础 。根据 36 氪 , 在 ChatGPT 公开前 , 字节跳动对大模型的投入存疑 。但字节跳动在工程团队和云服务团队方 面并无短板 。1)算力:字节并不缺 GPU 。字节旗下的企业技术服务平台火山引擎 , 在 2021 年 正式进军基础云市场(IaaS 层) , 为大模型所需的算力奠定了基础 。4 月 18 日 ,  火山引擎发布自研 DPU 等系列云产品 , 并推出新版机器学习平台:支持万卡级大 模型训练、微秒级延迟网络 , 弹性计算可节省 70%算力成本 。同时 , 火山引擎宣 布与字节跳动国内业务并池 , 抖音等业务的空闲计算资源可极速调度给火山引擎 客户使用 。
2)算法:阿里巴巴 M6 大模型的原带头人杨红霞现已加入字节 AI Lab(人工智 能实验室) , 参与语言生成大模型的研发 。模型应用:可用于图文、视频内容生成等 , 飞书将推出智能 AI 助手“My AI” 抖音、今日头条基于 AIGC 生成图文内容 。在 AIGC 的加持下 , 用户上传照片后 ,  短时间内系统即可自动生成不同风格的图片 。例如 , 抖音上线该“漫画脸”特效 后 , 吸引了大量用户 , 据抖音平台数据显示 , 截至 2022 年 12 月 6 日 , 该特效已 经超 2428 万人使用 , 并迅速飙升至特效潮流榜 TOP1 。