论文部分内容阅读
随着人们获取知识、传播资源的方式逐渐从翻阅书籍转换为在线图片搜索、图片传输信息等方式,在线教育成为教育领域比较热门的一种方式;同时,在大学教育中学生们越来越频繁的通过查阅文献开展研究。数学公式作为数学学科最基本的单元,存在形式固定、语言固定等特点,直接通过识别数学公式图像利用识别结果进行资源索引的方式,对在线教育普及发展有重大意义,且会极大地方便文献索引。基于数学公式图像识别结果进行资源索引的研究综合了图像处理、模式识别等多学科的知识,具有广阔应用前景及重要的研究意义。 本文以印刷体数学公式图像识别作为研究对象,分别对图像二值化、字符切分、字符识别、公式结构分析、公式语义分析等问题开展研究,具体包括以下几个方面的工作:使用自适应局部阈值的二值化算法进行图像二值化,获得二值图像;通过连通体分析、连通体合并及拆分进行符号切分;对于切分后的字符使用梯度直方图特征描述字符继而构建两级的多层神经网络进行字符识别;对于识别后的数学公式符号,通过分析运算符的优先级、结合性、运算数个数及位置等信息获得数学公式的结构信息及语义信息;最终以Latex格式输出数学公式的分析结构,并采用字符识别准确率、字符识别召回率、公式识别准确率等评价标准进行公式识别结果的评测。 在大量数学公式图像上的比对分析实验表明,本文所设计的数学公式识别系统可在大部分图像中取得满意的识别结果,同时在识别速度上也可以满足实际应用的需求,达到了预期的研究目标。利用本文工作成果,可方便地进行公式的自动索引和检索,大大减少了人工标注的工作量。