论文部分内容阅读
汉字是目前世界上仅存的起源于象形的点画结构的文字,在汉字书写的基础上,人们逐渐建立起了独特的书法艺术。由于现存的书法原稿中所涉及的汉字极为有限,如果想为各种书法字体建立相对标准且便于推广使用的字库,就必须能够从已有的书法汉字重构其他汉字。
基于这一设想,本人查阅大量资料,发现目前汉字字形技术的研究主要集中在汉字字形分析、字形数学描述、少数民族文字和古文字字库建设等方面。汉字字形数学描述的研究较为成熟,有很多种方法可以由文字图片获取点阵或轮廓数据。数据库技术在中文信息处理中,尤其是在语料库的建设中应用较为广泛。但是从汉字重构的角度对汉字结构进行详细分析和数学描述,从汉字中划分并提取部件字形信息,在字形处理技术应用数据库技术,从而由部件重构汉字的具体方法和技术的研究在国内仍是空白,国外也少见该领域的研究。
本文主要研究内容为构建一个基于字型结构的汉字造字数据库,即如何根据汉字的结构形体属性,将汉字部件、汉字结构类型、汉字索引信息等存储到数据库中,并以此为基础实现书法汉字重构。具体包括以下几方面的内容:1.由部件重构书法汉字的实现思路和系统构成。2.汉字结构类型分析和数学描述。3.基于字型结构的汉字造字数据库的构建。4.编程实现基于汉字造字数据库的书法汉字重构。将基于字型结构的汉字造字数据库作为一个基础数据平台,可为很多其他应用提供支持,还可以为减小汉字字库存储量,实现独特而又风格多样的电脑汉字艺术甚至提高手写汉字识别效率等提供帮助。
除了这些可以预见的应用,一该研究的意义更在于一种新思路的提出,对字形结构的有限划分和数学描述,以及数据库技术的引入,为汉字字形处理开辟了一个新的领域。