5 分钟,看完没有人比你更懂“语音识别”!

奶酪对“语音识别”的研究,
最早是想把自己喜欢的视频文案保存起来,因为视频内容不仅占用空间大,还没办法全文索引 。
将视频的内容“文本化”,我们就能提炼出视频的关键信息,而且还能获得视频细小处的一些遣词用字 。
把 20GB 的视频,压缩为 2MB 的文本 。
这在以前是断不敢想像的事情,然而现在有了人工智能的加持,这一切都变得触手可及 。
一、在线转录
国内最早免费开放在线语音转文字的应用,是网易见外 。
它不但是速度快,准确率还超出了人们预期,真正做到了一键转录,被盛赞业界良心,然后没多久,它就下架了 。
而现在接棒的是——飞书妙记 。
1.1、飞书妙记
飞书妙记是抖音旗下产品,注册登陆后就直接上传音频和视频,即使不需要介绍,你也一看就知道怎么用 。
地址:
1.2、使用体验
速度:快,10 分钟视频只花费了 1分 25 秒 。
准确率:绝大部分内容都能正确识别,而且能区分不同说话人 。
特色功能:支持中英日 3 种语言,能自动添加标点符号和章节分段,支持免费导出为 TXT 和 SRT 格式 。
【5 分钟,看完没有人比你更懂“语音识别”!】1.3、同类产品
如果要说有什么缺点的话,那就飞书妙记的免费用存储空间,从原来的 100G 变成 2G,一下子就寒酸了许多 。
但和同类产品相比,飞书妙记仍然是更好的选择 。
比如讯飞听见、钉钉闪记、阿里云、百度云等产品,它们要么免费额度少,要么需要申请 API,使用门槛高 。
而飞书妙记,你可以将视频转换为音频来缩小体积,又或者通过删除已经转写的内容来释放空间 。
换句话说,你还是可以无限白票 。
二、软件转录
如果你需要转录的内容很多,又或者很长,那么,使用桌面软件来操作会更加方便 。
而在这个领域的佼佼者是 —— 剪映 。
2.1、剪映
剪映也是是抖音旗下产品,它是一款桌面视频剪辑软件,但同时提供了识别语音功能,使用时需要联网使用 。
使用方法也很简单,点击导航栏“文本”,然后选择“智能字幕”,即可一键生成字幕 。
地址:
2.2、使用体验
同样是抖音系产品,剪映的准确率也很高,转录速度更是极奇的快,同样 10 分钟的视频,剪映只用 32 秒 。
而且,我们不用像“飞书妙记”那样担心空间不够用 。
因为抖音不担心自己的语音识别技术被白票,它们担心的,是没有人上传视频到抖音 。
抖音推出剪映的目的,是为了降低用户制作视频门槛,让更多的人参与到视频制作来,抖音的收益在别处罢了 。
2.3、同类产品
目前国内能与剪映对标的,当属 B 站推出的“必剪” 。
它的产品逻辑一样,也是为了方便用户创作视频,然后上传到 B 站 。
然而在免费额度上,必剪远不如剪映,必剪只支持 15 分钟的音频转录,而剪映最大支持 2 小时且不限使用次数 。
而且,剪映现在还支持导出字幕,你可以将导出的字幕用在其它软件上,抖音格局大了 。
应该说,剪映是视频创作者的必备 。
三、离线转录
上面的两款应用都需要联网使用,如果你比较在意隐私的问题,那么你需要一款离线的语音识别工具 。
推出的语音识别模型,绝对是目前最好的选择,没有之一 。
对,它和是同门师兄弟 。
3.1、
多语言语音识别模型,通过了 68 万小时的语音数据训练,支持 99 种语言,对英文的表现更是强无敌 。
更重要的是,它开源免费,在电脑上就能离线使用 。