【摘 要】
:
古籍汉字图像检索是古籍汉字研究人员高效获取相关古籍字形的有效途径。然而,古籍汉字数量庞大、结构复杂、字形多变等特点,导致传统的汉字图像检索技术在面对古籍汉字图像时难以取得令人满意的结果。因此,有必要针对古籍汉字特点,研究有效的古籍汉字图像检索技术,满足古籍汉字研究的实际需要。通过对古籍汉字特点的分析与归纳,引入犹豫模糊集理论,对古籍汉字图像检索关键技术展开研究,主要工作分为以下两部分:(1)设计了
论文部分内容阅读
古籍汉字图像检索是古籍汉字研究人员高效获取相关古籍字形的有效途径。然而,古籍汉字数量庞大、结构复杂、字形多变等特点,导致传统的汉字图像检索技术在面对古籍汉字图像时难以取得令人满意的结果。因此,有必要针对古籍汉字特点,研究有效的古籍汉字图像检索技术,满足古籍汉字研究的实际需要。通过对古籍汉字特点的分析与归纳,引入犹豫模糊集理论,对古籍汉字图像检索关键技术展开研究,主要工作分为以下两部分:(1)设计了基于犹豫模糊集的古籍汉字图像切分算法研究、设计古籍版面图像去噪、切分算法,得到古籍汉字预切分结果。在此基础上,对预切分结果中存在的过切分和欠切分错误进行校正,利用犹豫模糊集在处理多属性决策问题方面的优势,通过对预切分汉字的特征分析,建立犹豫模糊集,实现对存在过切分错误区域的鉴别及合并处理,并对存在粘连和重叠问题的汉字区域采用分段像素跳跃数突变分析方法进行分割,得到古籍汉字单字图像。采用《四库全书》中的文渊阁、文津阁、文溯阁、文澜阁共92页样张图像(28886个单字)进行实验,提出的方法对过切分汉字的合并准确率为85.7%,汉字的切分准确率为92.3%。(2)设计并实现了基于犹豫模糊加权距离测度的古籍汉字图像检索算法对古籍汉字图像进行特征选择与提取,采用重叠规范化双弹性网格划分,归纳古籍汉字图像在多个方向上的特征,定义古籍汉字图像在笔画特征、角点特征、字形结构特征、统计特征下各个指标对应的隶属度函数,在此基础上形成古籍汉字图像检索的犹豫模糊集合。最后,利用目标图像与待检索图像间的犹豫模糊加权距离测度作为相似度度量,获取古籍汉字图像的检索结果。在切分得到的26661幅古籍汉字图像上的检索查全率和查准率分别为76.5%和78.9%。表明所提出的古籍汉字图像检索方法能够适应古籍汉字图像的特点,达到较高的性能。
其他文献
在酱油酿造过程中,多种微生物协同生长,相互作用,通过自身丰富的酶系将原料中蛋白质、多糖等大分子物质水解,并产生多种代谢物质,最终共同构成了酱油独特的滋味与风味。其中微生物与代谢产物的关系至今研究不够明晰,因此本课题模拟高盐稀态酱油多菌种酿造过程,基于代谢组学和生物信息学分析手段,研究对比了单菌种米曲霉及混合菌种(Asprrgillus oryzae和Asprrgillus niger)在制曲和发酵
为研究智慧工地在项目建设安全生产管理中的应用,系统研究了智慧工地的背景与发展现状、国内安全生产形势、安全生产事故的发生规律,从管理对象和管理流程两个切入点,对智慧
矿产资源的开发和利用造成的环境污染越来越受到社会各界的广泛关注,其中由酸性矿山废水带来的土壤重金属及酸化污染是最受人们关注的环境问题之一。本研究以广东大宝山矿区
质子交换膜燃料电池(PEMFCs)作为目前最具前景和最受关注的新能源技术之一,具有无污染、能量转换率高、工作温度低、噪音低等众多优点,能广泛应用于交通运输车辆、热电联产、
医学断层图像的三维重建作为一种提供生物组织三维模型的技术手段,一直以来深受人们的重视。在医学应用上,三维重建不仅能够提供三维模型,还能展示三维模型的空间位置。通过
<正>1934年 1月黄河水利委员会委员长李仪祉制定出《治理黄河工作纲要》,提出了以现代水利科学方法治理黄河的工作要点。 1935年 8月23日~9月2日国民政府黄河水利委员会挪威籍
<正>"95后"小林将一只裱好的i Phone5挂上闲鱼网,定价120元。将旧手机零部件拆下,装裱好后再出售,成为许多年轻人的风尚。旧手机何去何从,是一个问题。有数据显示,2015年至20
初中音乐课是中学校园授课的重要课程,对同学的生活成长有着至关重要的作用,是建设素质教学,创新型教学的关键途径。伴随着新课程改革的大力发展,德、智、体、美全面发展培养
油菜是青海省第一大作物,但是青海省东部农业区施肥存在不均匀、不合理现象。春油菜氮肥施用量过高,磷肥施用量偏高现象也在加剧,钾肥与有机肥投入较少。针对青海省春油菜区
人参皂苷是人参中的有效成分,具有多种药理活性,尤其是稀有人参皂苷,药用价值较高。但人参药材栽培周期长,成本高,近年来价格也呈现出持续上涨的趋势,难以满足医药工业生产的