语音处理
词条百科 0
目录
语音处理
语音处理是对语音信号和信号处理方法的研究。信号通常以数字表示形式进行处理,因此语音处理可以看作是数字信号处理的一种特殊情况,应用于语音信号。语音处理的方面包括语音信号的获取、操作、存储、传输和输出。输入称为语音识别,输出称为语音合成。
语音处理的历史
语音处理和识别的早期尝试主要集中在理解一些简单的语音元素,如元音。1952年,贝尔实验室的三位研究人员斯蒂芬.Balashek、R.Biddulph和KHDavis开发了一种系统,可以识别单个说话者所说的数字。1940年代报道了使用频谱分析的语音识别领域的开创性工作。
线性预测编码(LPC)是一种语音处理算法,由名古屋大学的板仓文忠和日本电报电话(NTT)的斋藤修三于1966年首次提出。BishnuS.Atal进一步发展了LPC技术和1970年代贝尔实验室的ManfredR.Schroeder。LPC是IP语音(VoIP)技术的基础,以及语音合成器芯片,例如Speak&Spell中使用的德州仪器LPC语音芯片1978年的玩具。
1990年发布的首批商用语音识别产品之一是DragonDictate。1992年,由劳伦斯·拉宾纳(LawrenceRabiner)和贝尔实验室的其他人开发的技术被AT&T在其语音识别呼叫处理服务中使用,以在没有人工接线员的情况下路由呼叫。至此,这些系统的词汇量已经超过了人类的平均词汇量。
到2000年代初,占主导地位的语音处理策略开始从隐马尔可夫模型转向更现代的神经网络和深度学习。
语音处理的技术
语音处理的应用
内容来源于网络,本内容不代表16map.com立场,内容投诉举报请联系16map.com客服。如若转载,请注明出处:https://16map.com/wiki/nmdekixlmite