论文部分内容阅读
草图交互是新一代计算模式环境中自然(非受限)人机交互的研究热点之一。由于手绘草图固有的模糊性特点,如何将非精确手绘草图转化为计算机可处理的精确信息成为草图交互的主要研究课题。本文从支持草图交互的完整需求出发,研究支持草图交互所需包含在线草图识别和离线草图解析两个层面的草图理解技术(SketchUnderstanding),并重点围绕草图理解中的笔画分割、图符分组、草图解析等技术进行了深入而系统的研究。
本文的创新性成果主要包含以下几个方面:
(1)提出基于隐马尔可夫模型的笔画分割方法:构建了能够描述任意由直线段和弧线构成笔画的模型,将笔画以特征点的特征向量序列表示,并将笔画分割问题转化为寻找输入笔画与模型的最佳匹配问题,从而可同时完成分割点查找与图元类型判定,且能够对平滑过渡曲线进行有效分割;为解决草图绘制的非精确性问题,使用连续隐马尔可夫模型对笔画进行描述。这初步解决了由于用户绘制习惯不同而导致的数据描述不一致性问题,为草图理解工作奠定了基础。
(2)提出基于笔画聚合度以及LR文法的图符分组方法:对图符分组特征进行系统分析,提出分组特征层次模型。首先,在图元几何特征的基础上,定义两种评估空间分布紧密程度的标准:关联属性和界限属性,并据此提出基于笔画聚合度的分组方法,可有效减小分组过程对领域知识的依赖;其次,提出基于LR文法的图符分组方法,将草图表示为图元及其空间关系的组合,并引入模糊逻辑从图元、关系、图形等三个不同层次对可能存在的模糊性进行处理,可有效降低方法对用户绘制方式的依赖。这为面向流畅绘制的草图交互技术提供了支持。
(3)提出基于动态规划算法的草图解析方法:将草图解析定义为多阶段决策最优化问题。为处理草图绘制在空间关系上的模糊性,引入连续连接关系计算方法,并以此解决图符分类方法对伪样本排除能力不强的缺陷;引入二维动态规划算法处理图符交叉绘制的情况,有效降低了方法对底层处理结果的依赖。最后,提出一种基于采样点层的解析性能评价标准,可对部分解析正确的图符进行准确描述。这为理解自由绘制的草图奠定了基础。
(4)考察草图理解技术的领域可扩展性:提出基于手绘草图的二维卡通人脸动画生成框架,从而使不具备动画专业知识的用户也能够简单快速地实现动画效果;将基于动态规划的草图解析方法分别应用于电路图、UML图以及程序框图绘制,根据不同绘制制定了不同的图符识别策略。这初步证实了方法的领域可扩展性,并为草图理解技术在其他领域的应用做好了铺垫。