语音技术 文字转语音技术

导读大家好 , 来宝来为大家解答以下问题 , 文字转语音技术 , 语音技术很多人还不知道 , 今天让我们一起来看看吧!1、什么是语音识别技术?2、语音识
大家好 , 来宝来为大家解答以下问题 , 文字转语音技术 , 语音技术很多人还不知道 , 今天让我们一起来看看吧!
【语音技术 文字转语音技术】1、什么是语音识别技术?
2、语音识别技术(Speech recognition technology)是一种让机器通过识别和理解的过程 , 将语音信号转换成相应的文本或命令 , 即让机器理解人类语音的高技术 。
3、也就是说 , 如果电脑装有“语音识别”程序组 , 那么当你的语音通过转换装置输入电脑并进行数字化存储后 , 语音识别程序就会开始将你输入的语音样本与预存的语音样本进行比对 。声音对比完成后 , 计算机会输入它认为最“形象”的声音样本的序号 , 这样它就能知道你刚才读的声音的意思 , 然后执行这个命令 。说起来容易 , 但是真正建立一个高识别率的语音识别程序组是非常困难和专业的 。全世界的学者都还在努力研究最好的方法 。学者们发展了许多方法来解决这个问题 , 如傅立叶变换、倒谱参数等 。以至于现在的语音识别系统已经达到了可以接受的程度 , 而且识别度越来越高 。
4、计算机语音识别的过程与人类语音识别的过程基本相同 。目前 , 主流的语音识别技术都是基于统计模式识别的基本理论 。一个完整的语音识别系统大致可以分为三个部分:
5、(1)语音特征提取:目的是从语音波形中提取随时间变化的语音特征序列 。
6、(2)声学模型和模式匹配(识别算法):声学模型是识别系统的底层模型 , 是语音识别系统最关键的部分 。声学模型通常通过训练获得的语音特征来生成 , 目的是为每个发音建立发音模板 。在识别过程中 , 将未知语音特征与声学模型(模式)进行匹配和比较 , 并计算未知语音的特征向量序列与每个发音模板之间的距离 。声学模型的设计与语言发音的特点密切相关 。声学模型单元(单词发音模型、半音节模型或音素模型)的大小对语音训练数据量、系统识别率和灵活性有很大影响 。
7、(3)语义理解:计算机从语法和语义上分析识别结果 。理解语言的含义 , 以便做出相应的反应 。通常通过语言模型来实现 。
8、所谓“语音识别” , 就是利用电子计算机等机械设备来识别人说话的意思和内容 。20世纪50年代 , 有人提出了“听写打印机”的设想 。可以说这是语音识别技术最早的构想 。
9、语音识别技术经历了语音识别、语音合成和自然语音合成三个阶段 。原则上 , 计算机识别人的语言似乎并不难 。其实困难还是很多的 。比如 , 不同的人读同一个单词时发出的声音 , 声学特性并不完全相同;即使是同一个人 , 同一个词在不同情况下的发音也是不同的 。此外 , 人们说话往往脱离语法 , 有时夹杂一些俗语或省略一些词语 , 语速不一 。所有这些东西 , 在我们听别人说的时候似乎都不是问题 , 但是机器要理解却非常困难 。近年来 , 由于计算机功能日益强大 , 存储技术、语音算法技术和信号处理技术的巨大进步 , 以及软件编程水平的提高 , 语音识别技术取得了突破性进展 , 使其广泛应用成为可能 。