基于B/S模式的3D双语虚拟说话人的研究与实现

来源 :第七届和谐人机环境联合学术会议(HHME2011)暨第20届全国多媒体技术、第7届全国普适计算、第7届全国人机交互联合学 | 被引量 : 0次 | 上传用户:wuyonghong1974
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的不断发展,人们希望计算机具有更多的智能化和人性化,能够模拟人的方式与使用者进行交流.同时,人们也希望程序能够方便地获取、安装和使用.文本到可视语音的转换技术,正是实现计算机人性化的重要组成部分.本文基于本实验室的3D汉语虚拟说话人平台,采用视位映射的方法,建立了英语音素到汉语视位的映射,实现了支持英语和汉语两种语言的3D虚拟说话人,为实现统一参数的多语种虚拟说话人系统提供了一种解决方案;建立了一种基于分类处理的协同发音模型,提升了英语虚拟说话人口型的自然度.进而,本文采用B/S模式,通过ActiveX技术,将其封装为可以在浏览器中发布运行的插件,用户可以在浏览器中方便地访问、使用虚拟说话人服务,其质量和性能与传统桌面版虚拟说话人系统相同.
其他文献
新事件探测就是从多个新闻源中探测出报道一个新闻事件的第一篇新闻报道.本文针对新事件探测首先提出了一种基于时间、地点、人物(或组织)、内容等新闻要素建模的新闻表示方
We investigate a version of one velocity Baer-Nunziato model with dissipation for the mixture of two compressible fluids with the goal to prove for it the exist
社会化标签日益流行,用户可在不同网站标注不同媒体,如在Flickr标注图片.不同网站的标注信息可视为不同来源数据集.用户所加标签受噪音、歧义性和主观性等影响而难以反映被标
会议
协方差矩阵粒子滤波算法比基于颜色信息的粒子滤波算法在对目标进行跟踪时更具有鲁棒性,但计算复杂度过高.本文分析了基于协方差矩阵的粒子滤波算法的并行性,实现了基于GPU平
图像修复技术是当前图像处理和计算机视觉领域的一个研究热点,其目标是利用图像中已知区域的信息重建缺损区域.本文提出一种基于非局域样本块的图像修复算法,不同于传统图像
Background Asian population are at increased risk of bleeding during the warfarin treatment,so the recommended optimal international normalized ratio (INR) leve
在海量的视频片段数据库中探测具有相似内容的动画视频片段在视频检索中具有极其重要的作用.本文针对动画视频片段提出了一个可实时进行探测的有效探测方案.本文所定义的视频
针对已有的基于全零块的模式选择算法效率不高的问题,提出了一种基于全零块检测的帧间及帧内模式选择快速算法.算法首先根据最佳模式在全零块数上的分布选择帧间模式,并利用
本文提出了一种基于剧本分析的电影(电视剧)视频摘要的方法.首先利用动态时序匹配算法将剧本与字幕匹配,从而得到有时间标记的视频文本描述以及相应的语义结构;然后,通过对剧
针对视觉词袋模型中的特征量化问题,本文提出一种非负稀疏局部线性编码方法,有效改善了局部特征编码性能,提高图像非线性特征提取性能.其核心思想是利用非负稀疏表示选择与待