有道词典在线翻译下载 有道翻译在线翻译( 二 )


在比赛结束后,该团队将研究方案整理成论文发表,在基于目前最流行深度学习模型 Transformer 的技术上,研究人员开发出了一种基于端到端语音识别的口音分类算法,据了解该论文目前也被 ICASSP2021 接收 。

有道词典在线翻译下载 有道翻译在线翻译

文章插图
有道参加 INTERSPEECH 2020 比赛团队发表的论文 。
实验表明,有道提出的方法在测试集上达到了 72.39%的精度,在开发集上达到了 80.98%的精度 。在 2020 年 INTERSPEECH 口音英语语音识别挑战赛中,研究人员提交的系统在口音识别任务中排名第二 。
更重要的是,他们在比赛中使用的方案,和如今有道词典 app 中上线的功能思路相通 。「研究这些属性,归根结底是希望能够提升用户在不同场景下使用产品的体验,」王海魏表示 。「我们希望用户能够在遇到不同口音、不同语种的情况下都能获得更好的使用效率 。」
相比打比赛,一项技术的工程落地是个长期过程 。在有道 AI 团队,人们总是希望产品能够做到接近完美,LID 技术的迭代到最终上线花费了近四个月时间的打磨 。
与手机自带系统不同,有道词典 app 需要适配大量不同品牌型号的手机,而其中的一部分可能配置较低,甚至有一些品牌的设备对于录音功能的调用还会存在延迟 。一个小小功能的上线,背后是研发人员无数次尝试和努力 。
这样的工作很复杂,但有道一直在做 。
为什么有道翻译如此好用?
有道翻译拥有一个专注于技术落地的团队,其中算法团队的成员们主要根据业务的需求,调研、设计和实现各种相关算法,训练各类模型 。数据团队的成员则不断挖掘高质量训练数据,并根据算法的要求,对数据进行清洗、分类、标注等工作 。此外,高性能和研发团队负责优化模型训练的速度,实现推理引擎,优化服务性能,提供在线和离线的翻译能力 。
有道词典在线翻译下载 有道翻译在线翻译

文章插图
有道 AI 语音团队 。
在分工合作下,有道翻译提供的产品不断演进,逐渐成为了国内大量用户的首选 。目前,网易有道全线产品月活跃用户 (MAU) 已经超过了 1.2 亿 。
经常需要对外文翻译的同学可能会发现,百度、谷歌和有道翻译等系统在不同领域的内容上各有胜负,其实在不同领域上质量的差异,大多是由于训练语料的领域分布引起的 。如果为每个领域训练专用的模型可以得到较好结果,但成本较高,如果希望一个模型能够适配多个领域,一方面可以增加训练数据,另一方面也需要在模型,或者训练过程中对领域语料的使用进行优化,如在模型训练时引入领域信息,或者训练时对某些领域的语料进行重采样等 。
有道的翻译系统支持用户自定义术语表的扩展,可以根据用户提供的不同术语来实时优化翻译结果,给出正确的译文 。
「我们在训练中采取了多任务学习的方式,增加了待翻译文本的领域预测,使得整个系统在翻译不同的领域时都会较好的质量,」有道 AI NLP 团队负责人王瑾玫表示 。「另外,在一些对速度不太敏感的应用场景,我们探索了基于领域记忆库的实时优化算法,极大的提升了对应领域的翻译质量 。」
有道词典在线翻译下载 有道翻译在线翻译

文章插图
中英文混合的内容也可以被有道词典准确识别 。
自谷歌 2016 年在翻译系统中整合神经网络(GNMT)已过去近五年时间,而网易有道也紧随其后在 2017 年年初上线自研的 NMT,当前业界使用 AI 翻译的技术相比过去已经有了显著提高,但在一些真实场景中仍然能看到很多亟待解决的问题 。即使是在 Transformer 被广泛使用的今天,翻译质量还有不少可以提升的空间,比如低资源甚至零资源语言的翻译质量问题,虽然在多任务学习和预训练模型方法的使用上有了改善,但还可以再进一步提升 。
「使用 Transformer 模型也存在缺点,需要根据不同的任务场景进行一些优化,如在长句推理时计算量比较大,堆叠深度时模型能力难以提升,」王瑾玫说道 。「因此在有道翻译上,我们对离线应用,深度模型应用等任务上都做了相应的优化 。」
有道词典在线翻译下载 有道翻译在线翻译

文章插图
有道的硬件产品词典笔现在已经发展到了第三代,除了快速的翻译能力之外,还可以给你的口语发音打分 。
一个学习工具,要想从 0 到 1 获得人们的青睐是一件比较困难的事情,目前在教育领域里,像有道翻译这样热门的产品为数不多 。另一方面,对于有道来说,从「1 到 1.1」也是一种重要的创新 。