一种无监督的中文漫画对白自动定位方法

来源 :北京大学学报(自然科学版) | 被引量 : 1次 | 上传用户:guider_zq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文漫画图像的特点,提出一种无监督的中文漫画图像对白自动定位方法,以满足中文漫画移动阅读的需求。不同于现有基于学习的方法,该方法不需要训练集,且具有较强的鲁棒性,主要包括3个步骤:1)利用包围漫画图像文字的空白区域(气泡)的连通性进行气泡检测,并在气泡中检测完整字符对;2)基于字符形状与字符排版规则的一致性,聚类形成字符行或字符列,并提取字体特征;3)联合多页漫画图像字体特征,利用贝叶斯分类器检测多页漫画中的剩余字符。在包含900页漫画图像的数据集上进行实验,结果表明,该方法可以有效定位中文漫画
其他文献
目的 探讨针刺配合康复训练对脑卒中患者日常生活能力和运动功能的影响。方法 2016年3月—2017年10月社区收治的脑卒中患者86例,按就诊前后顺序依随机数字表法,分为研究组与
针对机器音译的两种主要方法——传统的基于统计的方法和目前流行的基于深度神经网络的方法,分别使用两种典型系统进行研究。实验结果显示,基于统计的方法和基于深度神经网络
目的探究高脂血症性急性胰腺炎诊断中检测C反应蛋白、降钙素原的临床意义。方法抽取2014年4月—2016年6月该院收治的72例高脂血症性急性胰腺炎患者,依据Ranson标准及CT分级将
基于荧光平行因子分析法(PARAFAC),对西藏昌都大骨节病病区与非病区饮水及沉积物中腐殖质进行研究。腐殖质总有机碳含量在病区和非病区样本间未表现显著差异。PARAFAC识别出5
利用美国驻中国大使馆2009年以来的PM2.5浓度监测数据、MODIS光学厚度数据和NCEP边界层气象要素数据,对近年来北京地区PM2.5和边界层内气象要素进行分析。结果表明:2009—201
IPv6(Internet Protocol version 6)是建设移动信息社会的重要基石,是集移动性、安全性和质量为一体的最佳选择。随着互联网的发展,IPv4暴露出来的缺陷越来越不适应发展的要求,
引黄联接段公路1 # 桥为装配式预应力空心板桥,有部分空心板出现不同程度的裂缝,属于温度裂缝,产生裂缝的原因主要是由于浇筑时和养护混凝土温度控制措施不当、养护时间短及台座基
发展中国家未来的灌溉尉永平(山西省水利科学研究所)121世纪对粮食产品的需求世界人口正成指数地增长。据估计,在本世界未世界人口增至60亿,到2025年至少增至80亿,到2050年将达到100亿。其中,增长的90%在