论文部分内容阅读
随着机器学习、人工智能等技术的发展,语音识别技术也得到了极大的发展,语音识别技术的渐渐成熟,渐渐有替代键盘和鼠标之势。在互联网环境下人工智能技术的得到跨越性的发展,将语音识别技术准确率提升到一个历史性的高度,使基于语音人机交互的方式在我们的生活得到了普及。人机交互的发展总共分为几个重要的历史阶段:第一个历史阶段是电脑的诞生,电脑是通过鼠标和键盘操作来完成人机交互。第二个历史阶段是智能手机平板电脑的触屏交互,她是通过手指交互。第三个历史阶段是使用语音交互的。基于语音的人机交互智能设备使用语音识别及语音合成技术对人类的语音进行操作,让各种智能设备能听懂人类的语言并能按照人的语言命令来行动,从而实现人机的语言交流。本系统主要讨论了基于语音的人机交互平台的设计与实现。人机交互平台分为四层:用户端设备、接入层、连接层、后端服务。用户端设备主要用来接收用户的语音信息,端设备主要包括智能音箱、App等。接入层主要负责接入和转发用户的语音请求,并且进行全局流量的调度、数据分析,同时还具备安全防御和请求负载分发功能。连接层主要负责设备端和云端服务的通信,定义他们之间的通信协议。后端服务主要负责将多语音源的输入进行归一化处理、差异化输出,以及准确解析用户语音的意图,并将用户的语音请求关键信息下发给具体处理用户意图的后端服务模块,然后对用户的意图进行处理,响应用户的语音请求。语音人机交互平台的实现,能够让更多的人接入平台开发自己的技能,这样智能设备就能够懂我们的语言,可以在智能家居场景、车里、家电设备等都可以使用,彻底的解放我们的双手,提供非常好的智能化的服务和用户体验。