论文部分内容阅读
文种识别技术能够识别图像中文本的语言种类,为后继的OCR处理提供重要的先验知识。通过分析各种语言文本图像的差异,本文引入多尺度小波变换,分别对每种语言的训练集提取小波特征进行主分量分析,建立每种语言的PCA模型,以待识别图像的重建误差为分类标准,实现文字种类的识别。试验表明,该方法能够有效区分中文和英文文本图像。