比ChatGPT更强的星火大模型V2版本发布!

初体验 测试PPT生成
结果:
达到了我的预期,只需要微调就可以直接交付,这点比要强很多.
测试文档问答
结果:
这点很新颖,现在类似这种文档问答的AI平台收费都贵的离谱,星火不但免费支持而且效果也不错 。
简历生成
全图:
效果非常好,而且模板选择的也很好看,还可以直接下载,稍微修改后就能用了,说实话这已经超出了我的预期很多,对于很多打工人来说很方便 。
星火助手测试
IT技术专家测试
生成速度非常块,而且达到了我的预期,很不错 。

比ChatGPT更强的星火大模型V2版本发布!

文章插图
游戏攻略达人测试
它真的在帮我想办法,我哭死,不过写的确实很棒 。
测试完成,效果很好,也可以自己申请,现阶段免费,早用早享受,传送门:链接,以下是一些本次星火V2.0版本的相关资讯
体验地址: 讯飞星火认知大模型
通过此链接可直接获取300w ~ 500w用于星火大模型API使用 。
国产大模型迎来又一次“升华” 。
8月15日,科大讯飞如期发布“讯飞星火认知大模型V2.0版本”(简称:星火V2.0) 。星火V2.0此次最大的升级在于代码能力和多模态能力的大幅提升 。
据科大讯飞董事长刘庆峰介绍,从业界参考测试集上的效果对比来看,星火V2.0基于和C++进行代码写作能力已高度逼近,差距仅为1%和2% 。
同时,他明确了星火大模型远期目标:到10月24日星火大模型代码能力全面超越,明年上半年将正式对标GPT4 。
现场演示代码生成游戏
据了解,相比之前的星火V1.5版本,星火V2.0的文本生成能力提升72%,语言理解提升78%,知识问答提升70%,逻辑推理提升60%,数学能力提升72% 。最为显著的能力升级自于两个方面,其一是代码生成、代码补齐、代码解释、代码纠错和单元测试生成等能力 。
刘庆峰在发布会上坦言,星火认知大模型目前数学能力目前已经超过,“但离我们的期望还有一段距离” 。科大讯飞在发布会现场也演示了星火大模型最新的代码能力 。
演示人在现场向星火大模型下达一段指令,即用完整实现以下功能:判断输入字符串是否符合码规则,密码规则为长度不小于8位,必须包括大小写、数字及特殊符号 。随后,星火大模型给出的代码在系统中顺利跑通 。
另外,星火大模型还可以使用处理视频 。在演示过程中,星火V2.0使用处理了一段长达2分钟的视频,从中提取第二到第十秒,把画面缩小一半,同时加速5倍,然后保存成gif图片 。在现场演示中,星火大模型甚至完成“贪食蛇”游戏的代码生成,并令游戏流畅运行 。
据刘庆峰介绍,从业界参考测试集上的效果对比来看,星火V2.0基于和C++进行代码生成能力已高度逼近,差距仅为1%和2% 。同时,与星火V1.5相比,其Java和JS语言的生成能力也分别提升了15个百分点和23个百分点 。
在科大讯飞看来,代码是一项硬碰硬的能力,不存在任何主观评分标准,所以其也被视为大模型聪明程度的重要标志 。根据数据显示,92%的美国程序员正在使用 AI工具 。国海证券认为,代码能力的提升将进一步提升大模型的用户规模 。
据透露,在科大讯飞内部,星火V2.0的代码采纳率提升了30%,编码效率提升了30%,综合效率提升15% 。
多模态能力价值将凸显
星火V2.0另一重大升级则在多模态能力方面 。据了解,这一最新版本大幅提升了多模态理解(包含视觉问答、描述、推理等)及多模态生成(文图生成、可控语音合成)方面的能力 。
刘庆峰直言,“多模态能力是人工智能必由之路 。”而且在业内看来,近期随着妙鸭相机、等爆款频出,未来大模型的多模态能力价值将会凸显 。