基于小波和PCA的文种识别算法

来源 :中国科协第四届优秀博士生学术年会 | 被引量 : 0次 | 上传用户:bleachff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文种识别技术能够识别图像中文本的语言种类,为后继的OCR处理提供重要的先验知识。通过分析各种语言文本图像的差异,本文引入多尺度小波变换,分别对每种语言的训练集提取小波特征进行主分量分析,建立每种语言的PCA模型,以待识别图像的重建误差为分类标准,实现文字种类的识别。试验表明,该方法能够有效区分中文和英文文本图像。
其他文献
本文针对已有的蛋白质二级结构模型存在的不足,提出了一种新的基于数据挖掘技术的递归神经网络的模型ENN,并利用遗传BP算法作为该模型的学习算法。通过相关的实验与结果分析,证
前期对酵母基因上游序列的分析结果显示高效转录基因上游的序列在长度、寡核苷酸使用、以及寡核苷酸在序列中的分布等方面都有着区别于低效转录基因上游序列的特征,而且高效转
基于基因表达谱的肿瘤分类方法有望成为临床医学上一种快速而有效的肿瘤诊断方法。但由于基因表达谱数据存在维数过高、样本量很小以及基因冗余和噪音大等特点,使得提取与肿瘤
会议
前期研究中从胃癌患者肿瘤组织中分离得到间质干细胞(mesenchymal stem cells,MSCs)样细胞,并证实这一类细胞具有肿瘤相关成纤维细胞的基本特性,能够体内外促进肿瘤生长,但机
雷公藤内酯醇(Triptolide)是多年生卫矛科植物雷公藤(Tripterginum Wilfordii Hook.F)的主要活性成分之一,具有抗炎、抗肿瘤、免疫抑制等多种活性受到了全世界的关注.雷公藤
蒲氏钩蝠蛾Thitarodes pui是冬虫夏草菌Ophiocordyceps sinensis的寄主之一,是名贵滋补药材冬虫夏草发生的物质与营养基础.簇虫gregarine属原生动物顶覆虫门,寄生于无脊椎动
桑蟥是桑园里的主要害虫之一,属于鳞翅目蚕蛾科桑蟥属.本文根据鳞翅目昆虫已鉴定的孵化酶基因保守序列合成兼并性引物,并从桑蟥转青卵中克隆出部分孵化酶基因.通过RACE-PCR和
目的:观察siRNA抑制小鼠脑abcg4基因表达后,对阿尔茨海默病(Alzheimers Disease,AD)相关基因表达的影响.方法:根据KM小鼠脑中abcg4基因序列设计序列特异性的siRNA,将小鼠随机
  Peptidoglycan recognition protein (PGRP) specifically binds to peptidoglycan (PGN) and plays an important role as pattern recognition receptors in the innat