【摘 要】
:
由于深度学习的快速发展,自然场景的文本检测方法在近些年取得了丰硕成果,不依靠手工提取特征的方法,在速度和精度上都不断进步着。然而目前的大多文本检测方法对于文本区域的描述不够精确,使用和通用目标检测相同的矩形框,无法准确地表示弯曲或倾斜的文本区域,会使检测结果含有过多的背景内容,对之后的识别工作也有很大的影响。即便是采用带角度的矩形框,也不能很好地表示一些弯曲的文本区域。为了解决这一问题,本文提出了
【机 构】
:
哈尔滨工业大学计算机科学与技术学院,哈尔滨工业大学媒体技术与艺术学院
【基金项目】
:
国家自然科学基金(61672194),国家重点研究与发展计划(2018YFC0832304),中国黑龙江省杰出青年科学基金(JC2018021),国家机器人与系统国家重点实验室项目(SKLRS-2019-2019-KF-14)