论文部分内容阅读
文本作为知识的主要载体,是人类获取信息的主要来源。但随着知识和文本数量的增长,人们发现利用知识的难度也在增加,人们与知识之间的距离在不断增大,迫切需要一种简便的文本知识处理方法,能够利用计算机自动从文本中获取更多的有用信息,并实现知识共享、知识服务等应用。
但现有的方法往往受文本领域限制,难以扩展。同时无法把知识获取、处理、组织、应用等有机结合,各个部分之间相互脱节,也制约了方法的进~步应用和推广。
本文以文本知识处理为主要研究内容,从文本知识获取、组织、应用方面进行了探讨,提出了一种领域无关的文本知识处理方法,并将其应用于智能叙事生成领域。经过实验以及实际使用,均取得了令人满意的效果。
主要工作及创新点包括:
(1)提出一种基于本体的半结构化文本知识处理方法(Ontology-MediatedKnowledge Processing for Semi-structured Text,简称OMKP)。OMKP方法把本体知识引入文本处理过程中,以半结构化文本为主要处理对象,利用多主体思想,结合模式匹配的技术,实现了文本知识的自动获取和理解。OMKP把知识处理过程和具体应用分离开,但同时又以本体知识为桥梁把二者联系起来。从而使得OMKP方法具有较好的通用性,具有应用、领域、语言无关的特点。我们已将此方法用于多个实验和实际应用中,取得了满意的效果。
(2)为了实现OMKP的设计思想,定义设计了一种通用的可执行的参数化知识编程语言(Executable Parametric Knowledge Programming Language,简称ePKPL)。这是一种声明型参数化编程语言,以知识处理为目标,以文本语料为处理对象。ePKPL程序主要包括语料文法描述和主体定义两个部分。主体利用文法描述对输入文本进行分析,并在分析结果上执行预定义的操作,从而实现对文本语料的自动处理。该语言具有较好的可扩充性。ePKPL程序只能在虚拟机上运行。
(3)提出了一种带有反馈自学习机制的文法分析算法。在主体对语料进行文法分析时,能够自动根据历史分析结果,调整产生式选择策略,不需事先进行训练,也无需人工干预,大大降低了手工工作量,更适用于大规模的文本知识处理。
(4)设计并实现虚拟机(Virtual Machine)平台,作为ePKPL多主体程序运行环境。虚拟机为用户提供了一种图形化的交互界面,集ePKPL程序编辑和调试、语料编辑、结果分析等功能于一体,为用户提供了灵活的操作界面。
(5)以知识服务和应用为背景,提出了一种智能叙事生成方法——观众中心叙事生成模型。该方法明确将观众认知和创作意图引入叙事创作过程中,从观众认知、故事人物目标、故事人物动作三个层面进行规划,利用已有的知识库资源,自动生成符合用户需求的个性化的叙事。为了保证方法的灵活性,该方法以OMKP为基础,对需求和文本知识库自动处理,使叙事生成方法更加通用。这一研究在教学、娱乐、模拟仿真等领域都有较好的应用前景。
(6)针对叙事生成方法,提出了一组定性的叙事生成评价标准,从而能够更全面地对叙事生成方法以及生成的叙事效果进行评价。
(7)设计并实现了用于叙事生成的系统平台PNAI(A Platform for Narrative andAnimation Intelligence)。平台以用户需求为输入,同时利用行为及目标常识知识库做为素材,根据观众中心叙事生成方法的思想,实现自动创作功能。PNAI可以输出脚本或动画形式的叙事。其中动画视频可以是在脚本的基础上结合各种动画模型,在Maya()动画引擎上渲染而得。