论文部分内容阅读
随着计算机硬件的发展,笔式交互作为一种高效、自然的人际交互方式,得到了快速的发展和广泛的应用。笔式人机交互中有一个非常关键、困难的问题就是如何让计算机理解人们绘制的草图,即草图理解。在过去10多年中,学术界和工业界对草图理解这一问题进行了深入、系统的研究,提出了一些解决方案和原型系统。
首先,在笔画分割中,基于曲率的方法对噪音敏感,基于速率的方法对用户绘制习惯、思维停顿敏感,结合曲率、速率的方法效率不够。其次,在草图解析中,有些方法对用户的绘制习惯、符号的绘制方法做了约束,降低了草图交互方式的自然性,还有一些方法仅仅能够识别草图中包含的符号,不能识别符号间的关系。最后,目前依然没有一种草图文档标准,为草图的存储、编辑、传输提供良好的媒体,传统的技术比如InkML、SVG等不能同时满足草图在笔迹信息、图形结构信息方面的要求。
本文针对如上问题,对面向连续绘制的在线草图理解方法进行了深入的研究,设计并实现了一种在线草图理解系统,其中我们的贡献可以概括为如下三个方面:
1.提出了一种基于相对曲率的笔画分割方法。我们采用曲率信息进行笔画分割是因为这符合人对草图的认识、理解过程,避免了利用速率进行分割带来的问题,比如对用户的思维停顿、绘制习惯敏感。我们提出了一种基于窗口的相对曲率计算公式,可以平滑笔画中由于采样噪音带来的抖动,同时该公式计算简便,速度性能好。我们还采用了一种二次分割的策略,在不同的分割步骤中,选取不同的分割参数,从而提高分割算法的灵活性,并提高分割效果。为了对笔画分割结果进行定量分析与评价,我们引入了信息检索中的两个概念:查全率和查准率,在此基础上设计了一种可以优化分割结果的参数选择算法。
2.提出了一种基于领域知识的草图解析方法。领域知识通过规则的形式描述,这样有两个好处:第一,人们可以方便的进行规则制定,从而将草图解析方法应用到多个领域;第二,利用规则引擎,计算机可以在规则的指导下进行草图解析工作。该方法不仅可以识别草图中的符号,还可以利用草图中的上下文信息识别符号间的链接关系。为了让用户拥有很大的自由度,我们没有对用户的绘制习惯、符号的绘制方法进行任何限制。
3.提出了一种基于XML的草图文档格式SketchML。通过结合InkML、SVG的优点,SketchML不仅可以处理草图的笔迹信息,而且可以处理草图的图形结构信息、上下文信息,甚至是应用领域的语义信息。
本文基于上述内容,分别进行了相关实验,很好地验证了方法的有效性和优点。