基于视觉与听觉检测的盲人阅读器研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:iris_1204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
盲人及视力障碍人士是我们社会的一个弱势群体,他们无法像普通人一样读书看报,然而在现实生活中,99%以上的文字信息都是以视力障碍人士无法阅读的纸制资料形式出现的,因此视觉能力的缺失使他们无法以最直观的方式获取信息。盲人阅读器正是一种将印刷品的内容转化为声音信号,供视力障碍人群获取信息的设备,使其在没有正常人帮助的情况下也能够方便地获得纸制文字信息。 本文设计了一个由文本图像预处理、字符识别、语音合成等部分组成的盲人阅读器软件实现系统。系统处理对象主要是印刷体文本图片。主要研究工作如下: (1) 在预处理模块的设计中,结合多种图像处理技术,运用了包括二值化、倾斜校正和字符分割等在内的一系列预处理算法,取得了较好的效果,为后面字符特征的提取打下了坚实的基础。 (2)为了解决单个分类器分类效果不理想的情况,从分类器集成的角度出发,提出了基于多个互补特征,多级粗分类与细分类相结合的分类器设计方案。其中粗分类包含基于字符骨架中闭合曲线和基于字符骨架中纵向线条特征的两级分类,达到了较平均的分割待识别字符集的目的,有效地缩短了细分类的识别时间。细分类器的特征提取采用基于网格特征和投影特征的组合特征向量,很好地兼顾了字符总体特征和局部特征,大大提高了字符识别的准确度。 (3) 归纳总结了现有TTS 功能实现的三种典型解决方案,结合课题研究的实际情况最终采用了利用微软SAPI5.1提供的具有TTS 功能的语音开发包的方案,极大地缩短了语音合成应用系统的开发周期,以较高的准确率实现了对已识别文本的语音输出,并且可以调整发音语音类型、语速及音量等合成属性。 实验结果表明,将字符识别技术与语音合成技术相结合,可以很好地实现盲人阅读器的功能。
其他文献
习近平总书记在全国宣传思想工作会议上的讲话中强调,“经济建设是党的中心工作,意识形态工作是党的一项极端重要的工作.”能否做好意识形态工作,事关党的前途命运,事关国家
期刊
本文通过对荣华二采区10
期刊
鳗鲡是世界主要水产养殖种类之一,中国是最大的生产国,总产量约占世界的70%。随着养殖集约化程度的提高,病害及药物残留问题日益突出,并严重制约着鳗鲡产业的可持续性发展。抗菌肽
近几年来小波变换在图像处理上获得了广泛的应用。它可以把时域、频域结合起来,对图像进行多分辨率分析。由于它能将图像信息分解成独立的不同频带的信号,有利于采用不同的编
伴随国民收入的逐步提高和生活水平的更上一层楼,人们对生活质量的需求成为了如今热议的话题.最近几年,随着一些品牌的介入和相关厂商的发力,国货潮流已经成为时尚圈十分热门
期刊
组蛋白修饰是表观遗传学研究的重要方面,组蛋白甲基化参与异染色质形成,X染色体失活,转录调节,干细胞的维持和分化,人类的寿命和肿瘤也和组蛋白甲基化密切相关。哺乳动物中,转录因
工业机器人的出现加快了制造业的发展,促进了工业生产结构的升级。工业机器人控制技术的发展水平在很大程度上体现了一个国家工业自动化的能力。工业机器人末端执行器位置和姿
党的十九大明确要求加强基层组织建设,提出“要以提升组织力为重点,突出政治功能,把企业、农村、机关、学校、科研院所、街道社区、社会组织等基层党组织建设成为宣传党的主
期刊
全面从严治党是习近平新时代中国特色社会主义思想的重要内容.近年来,太原钢铁(集团)有限公司采购部(以下简称“采购部”)党委以部门党组织建设与企业发展相互促进共同发展为
期刊
为适应自然环境中不断变化的光照条件,光合生物通过一种被称为状态转换的过程,调节激发能在光系统Ⅱ(PSⅡ)和光系统Ⅰ(PSⅠ)的分配,从而将波动光照条件下的光合效率维持在最佳水