盘点上半年国内大模型混战,最后一天还是杭州收官

火爆的AI大模型战场上,国外的、谷歌、微软等大厂正打得火热;国内以百度、阿里、华为、腾讯为代表的科技巨头,科大讯飞、实在智能、商汤科技等AI公司,三大运营商,以及智源研究院、中科院等研究机构都纷纷投身AI大模型浪潮 。
所谓AI大模型就是人工智能预训练模型,包含三大要素:大算力、强算法、大数据 。大模型相当于人工智能的土壤,没有大模型支持,就不会有AI的成功 。一起来看看2023年上半年国内大模型有哪些吧!
实在智能:TARS(塔斯)大模型
坐标杭州,2023年上半年大模型的收官之作:实在的国产大模型,TARS(塔斯)历经半年研发,近期正式上线开始内测 。这是国内人工智能企业、RPA赛道头部实在智能自研垂直领域的大语言模型,在TARS大模型中叠加了多项自然语言处理前沿技术,基于开源基座模型,在千亿级高质量上进行了充分训练,完整复现了、SFT和RLHF三个阶段,语言理解能力及指令跟随能力等在横向对比测试中均取得良好效果 。
网易:玉言、子曰大模型
在2023世界人工智能大会上,网易多款AI大模型落地产品首次亮相,集中展示了在人工智能基础设施层、引擎层、平台层、模型层、应用层的领先创新成果 。会上,由网易有道自研的首个教育大模型“子曰”最新应用成果——虚拟人口语教练首次亮相 。

盘点上半年国内大模型混战,最后一天还是杭州收官

文章插图
京东:言犀大模型
新一代京东大模型定位于产业版本的 。其中,一个平台为智能人机对话平台,两个领域为零售和金融,五个应用则包括内容生成、人机对话、用户意图理解、信息抽取和情感分类 。
360:360智脑大模型
【盘点上半年国内大模型混战,最后一天还是杭州收官】6月13日,360集团举行360智脑大模型应用发布会,认知型通用大模型“360智脑4.0”亮相,360智脑在多模态等关键能力上完成迭代,将全面接入“360全家桶”,同时360AI数字人正式发布 。
科大讯飞:星火认知大模型
2023年5月6日讯飞星火认知大模型正式发布,涵盖了文本生成、语言理解、知识问答、逻辑推理等七项核心能力,并持续迭代于6月9日再次升级发布星火认知大模型V1.5 。
商汤:日日新大模型
4月,商汤科技董事长兼首席执行官徐立宣布推出“日日新”大模型体系 。这个体系包含自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力 。
昆仑万维:天工大模型
4月10日,昆仑万维宣布联合奇点智源共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5 。
中国科学院自动化研究所:紫东太初大模型
6月16日,中国科学院自动化研究所发布紫东太初2.0 。相比1.0版本,在语音、图像和文本三模态的基础上,加入视频、传感信号、3D点云等模态数据,研究突破了认知增强的多模态关联等关键技术 。
在这个AI大潮中,产品不断涌现,竞争不断升级 。我们不应只看到其瞩目的一面,而是要更加关注技术的可持续发展,解决实际问题 。只有这样,AI才能在未来的道路上走得更远,为人类社会带来更大的福祉 。