基于B/S模式的3D双语虚拟说话人的研究与实现

来源 :第七届和谐人机环境联合学术会议(HHME2011)暨第20届全国多媒体技术、第7届全国普适计算、第7届全国人机交互联合学 | 被引量 : 0次 | 上传用户：wuyonghong1974

【摘要】

：

随着计算机技术的不断发展,人们希望计算机具有更多的智能化和人性化,能够模拟人的方式与使用者进行交流.同时,人们也希望程序能够方便地获取、安装和使用.文本到可视语音的

【作者】

：

林会杰[1]贾珈[2]王晓慧[3]蔡莲红;

【机构】

：

普适计算教育部重点实验室

【出处】

：

第七届和谐人机环境联合学术会议(HHME2011)暨第20届全国多媒体技术、第7届全国普适计算、第7届全国人机交互联合学

【发表日期】

：

2011年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机技术的不断发展,人们希望计算机具有更多的智能化和人性化,能够模拟人的方式与使用者进行交流.同时,人们也希望程序能够方便地获取、安装和使用.文本到可视语音的转换技术,正是实现计算机人性化的重要组成部分.本文基于本实验室的3D汉语虚拟说话人平台,采用视位映射的方法,建立了英语音素到汉语视位的映射,实现了支持英语和汉语两种语言的3D虚拟说话人,为实现统一参数的多语种虚拟说话人系统提供了一种解决方案;建立了一种基于分类处理的协同发音模型,提升了英语虚拟说话人口型的自然度.进而,本文采用B/S模式,通过ActiveX技术,将其封装为可以在浏览器中发布运行的插件,用户可以在浏览器中方便地访问、使用虚拟说话人服务,其质量和性能与传统桌面版虚拟说话人系统相同.

其他文献

一种基于新闻要素建模的新事件探测方法

新事件探测就是从多个新闻源中探测出报道一个新闻事件的第一篇新闻报道.本文针对新事件探测首先提出了一种基于时间、地点、人物(或组织)、内容等新闻要素建模的新闻表示方

会议

新闻事件建模事件探测算法计算方法新闻报道实验结果基于时间表示方法

Weak solutions for a bi-fluid model for a mixture of two compressible non interacting fluids

We investigate a version of one velocity Baer-Nunziato model with dissipation for the mixture of two compressible fluids with the goal to prove for it the exist

期刊

bi-fluid systemmultifluid systemBaer-Nunziato systemcompressible Navier-Stoke

基于稀疏非负矩阵分解的图像检索

社会化标签日益流行,用户可在不同网站标注不同媒体,如在Flickr标注图片.不同网站的标注信息可视为不同来源数据集.用户所加标签受噪音、歧义性和主观性等影响而难以反映被标

会议

基于GPU的协方差矩阵粒子滤波算法

协方差矩阵粒子滤波算法比基于颜色信息的粒子滤波算法在对目标进行跟踪时更具有鲁棒性,但计算复杂度过高.本文分析了基于协方差矩阵的粒子滤波算法的并行性,实现了基于GPU平

会议

GPU协方差矩阵粒子滤波算法计算复杂度颜色信息算法性能实验结果跟踪

基于非局域样本块的图像修复算法

图像修复技术是当前图像处理和计算机视觉领域的一个研究热点,其目标是利用图像中已知区域的信息重建缺损区域.本文提出一种基于非局域样本块的图像修复算法,不同于传统图像

会议

非局域样本块图像修复算法区域信息重建图像块组合系数研究热点

Optimal INR level in elderly and non-elderly patients with atrial fibrillation receiving warfarin: a

Background Asian population are at increased risk of bleeding during the warfarin treatment,so the recommended optimal international normalized ratio (INR) leve

期刊

BleedingIschemic strokeNon-valvular atrial fibrillationOptimal international

面向大规模的相似动画视频片段探测技术

在海量的视频片段数据库中探测具有相似内容的动画视频片段在视频检索中具有极其重要的作用.本文针对动画视频片段提出了一个可实时进行探测的有效探测方案.本文所定义的视频

会议

相似动画视频片段特征探测方案用户满意索引结构视频检索

H.264中基于全零块的帧间及帧内模式选择算法

针对已有的基于全零块的模式选择算法效率不高的问题,提出了一种基于全零块检测的帧间及帧内模式选择快速算法.算法首先根据最佳模式在全零块数上的分布选择帧间模式,并利用

会议

全零块检测帧间模式模式选择快速算法帧内预测模式最佳模式算法效率实验结果编码时间

基于文本的自动视频摘要

本文提出了一种基于剧本分析的电影(电视剧)视频摘要的方法.首先利用动态时序匹配算法将剧本与字幕匹配,从而得到有时间标记的视频文本描述以及相应的语义结构;然后,通过对剧

会议

文本摘要自动视频摘要重要程度影视剧本语义结构时序匹配算法剧本分析

非负稀疏局部线性编码

针对视觉词袋模型中的特征量化问题,本文提出一种非负稀疏局部线性编码方法,有效改善了局部特征编码性能,提高图像非线性特征提取性能.其核心思想是利用非负稀疏表示选择与待

会议

稀疏表示局部特征编码方法线性编码图像特征非线性特征局部坐标系线性空间

基于B/S模式的3D双语虚拟说话人的研究与实现

其他学术论文