论文部分内容阅读
语音识别是一门综合性很强的学科,是模式识别的一个重要分支,它涉及生物学、数学、电子学等方面的知识。语音识别的发展至今已经历了四十余年,已形成了相对比较成熟稳定的理论与算法。包括DTW算法(DynamicTimeWarping,动态时间规整)、LPC(LinearPredictiveCoding,线性预测编码)、VQ(VectorQuantization,矢量量化)、倒谱、HMM(HiddenMarkovModel,隐马尔科夫模型)等。这些理论与算法在孤立词识别、连接词识别、连续语音识别、说话人识别及语种辨识方面都有广阔的应用。著名的IBM公司的Viavoice就是采用连续隐马尔科夫模型实现的。采用DTW算法的小词汇量的语音命令控制系统也得到了很好的效果。
在现有语音识别理论研究没有较大突破的情况下,语音识别的应用研究已经逐渐成为了这一领域的研究热点。目前,语音识别的应用主要集中在语音输入、听写机、自动翻译、语音命令控制、电话语音交互等领域。例如,IBM的Viavoice是最成功的语音输入产品、Philips公司在手机方面的语音识别技术发展比较成熟。而且开展语音识别应用的公司也越来越多,比较著名的有国外的IBM、Philips、Nuance等公司;国内的有香港的InfoTalk、捷通等。有的产品是用软件来实现,有的专门设计了硬件芯片。这些都使语音识别的应用越来越普及。
语音技术同样也是当今迅猛发展的电子商务经济的最重要的‘推进器’之一。语音识别是一种技术手段,它的应用不能脱离应用主体去单独实施。企业级语音识别软件往往可被扩展为一个平台,集信息查询、信息点播、交易处理、统一消息四大功能模块于一体,很多人称之为语音门户。目前,常见的语音解决方案的供应商主要是IBM、Nuance、SpeechWorks、Philips,以及香港言丰科技公司。本文就电子商务中关于用户认证模块讨论了语音识别在其中的应用。
本文第一章介绍了电子商务中存在的安全问题,并就解决这些问题提出了建立一个基于语音识别的用户认证系统的方案。然后,第二章介绍了语音识别发展的历史、现状及前景,论述了实现一个用户认证系统所需要使用到的语音识别相关技术——说话人识别系统和连接词识别系统。第三章对常规的用户认证系统中使用的加密解密算法做了介绍,包括对称加密算法、非对称加密算法、数字签名和SSL通信,经过分析这些算法在应用方面存在的优缺点,提出了结合语音识别技术建立一个安全的用户认证系统的系统结构。第四章根据第二章和第三章中提出的理论及算法,从实验研究角度详细介绍了基于语音识别的用户认证系统的技术实现过程,包括客户端和服务器两方面的内容以及整个系统的结构图。最后,第五章对本文的主要创新做了总结,并提出了语音识别在用户认证中的应用还需要继续努力的几个方面。