论文部分内容阅读
本文论述了基于大词汇量词典的日文邮件地址手写体字符串的识别系统,所用词典包含了lll,349个地址短语。在识别过程中,文本行图像与词典入口进行匹配,以获得可靠的分割和合理的地址短语。在预分割中,文本行图像通过连接组件分析和以边缘轮廓线分析为基础的粘连模式分裂被分割为原始的段。词典匹配中,连续的段动态地合并成候选字符模式。一个精确的字符分类器嵌入在词典匹配中,以此从动态分类集中选择候选模式匹配的字符。在词典匹配中,采用了一种Beam搜索策略来荻取实时识别的效果。在测试3589封实际邮件的实验中,本文提出的方