文本知识处理方法及智能叙事生成应用研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:W6216286
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本作为知识的主要载体,是人类获取信息的主要来源。但随着知识和文本数量的增长,人们发现利用知识的难度也在增加,人们与知识之间的距离在不断增大,迫切需要一种简便的文本知识处理方法,能够利用计算机自动从文本中获取更多的有用信息,并实现知识共享、知识服务等应用。   但现有的方法往往受文本领域限制,难以扩展。同时无法把知识获取、处理、组织、应用等有机结合,各个部分之间相互脱节,也制约了方法的进~步应用和推广。   本文以文本知识处理为主要研究内容,从文本知识获取、组织、应用方面进行了探讨,提出了一种领域无关的文本知识处理方法,并将其应用于智能叙事生成领域。经过实验以及实际使用,均取得了令人满意的效果。   主要工作及创新点包括:   (1)提出一种基于本体的半结构化文本知识处理方法(Ontology-MediatedKnowledge Processing for Semi-structured Text,简称OMKP)。OMKP方法把本体知识引入文本处理过程中,以半结构化文本为主要处理对象,利用多主体思想,结合模式匹配的技术,实现了文本知识的自动获取和理解。OMKP把知识处理过程和具体应用分离开,但同时又以本体知识为桥梁把二者联系起来。从而使得OMKP方法具有较好的通用性,具有应用、领域、语言无关的特点。我们已将此方法用于多个实验和实际应用中,取得了满意的效果。   (2)为了实现OMKP的设计思想,定义设计了一种通用的可执行的参数化知识编程语言(Executable Parametric Knowledge Programming Language,简称ePKPL)。这是一种声明型参数化编程语言,以知识处理为目标,以文本语料为处理对象。ePKPL程序主要包括语料文法描述和主体定义两个部分。主体利用文法描述对输入文本进行分析,并在分析结果上执行预定义的操作,从而实现对文本语料的自动处理。该语言具有较好的可扩充性。ePKPL程序只能在虚拟机上运行。   (3)提出了一种带有反馈自学习机制的文法分析算法。在主体对语料进行文法分析时,能够自动根据历史分析结果,调整产生式选择策略,不需事先进行训练,也无需人工干预,大大降低了手工工作量,更适用于大规模的文本知识处理。   (4)设计并实现虚拟机(Virtual Machine)平台,作为ePKPL多主体程序运行环境。虚拟机为用户提供了一种图形化的交互界面,集ePKPL程序编辑和调试、语料编辑、结果分析等功能于一体,为用户提供了灵活的操作界面。   (5)以知识服务和应用为背景,提出了一种智能叙事生成方法——观众中心叙事生成模型。该方法明确将观众认知和创作意图引入叙事创作过程中,从观众认知、故事人物目标、故事人物动作三个层面进行规划,利用已有的知识库资源,自动生成符合用户需求的个性化的叙事。为了保证方法的灵活性,该方法以OMKP为基础,对需求和文本知识库自动处理,使叙事生成方法更加通用。这一研究在教学、娱乐、模拟仿真等领域都有较好的应用前景。   (6)针对叙事生成方法,提出了一组定性的叙事生成评价标准,从而能够更全面地对叙事生成方法以及生成的叙事效果进行评价。   (7)设计并实现了用于叙事生成的系统平台PNAI(A Platform for Narrative andAnimation Intelligence)。平台以用户需求为输入,同时利用行为及目标常识知识库做为素材,根据观众中心叙事生成方法的思想,实现自动创作功能。PNAI可以输出脚本或动画形式的叙事。其中动画视频可以是在脚本的基础上结合各种动画模型,在Maya()动画引擎上渲染而得。
其他文献
随着互联网技术的飞速发展,基于Web的电子商务、电子政务等各种应用系统在世界范围内迅速普及。网络活动甚至成为我们工作与生活中的重要组成部分。   网络技术与应用的百
移动自组网是由一组带有无线收发装置的移动节点组成的一个多跳的临时性无中心网络。在移动自组网中,节点一般采用电池的供电方式,电池的电量往往是有限的。由于无法像固定设备
多输入多输出MIMO技术可以提高频谱效率,被认为是未来无线通信系统的核心技术之一。如何有效利用MIMO提供的高带宽资源,是宽带无线通信系统面临的一个关键问题。与单输入单输出
万维网中资源通过超链接互联,而语义网中的资源通过语义关系互联。文档排序是现有搜索引擎的关键组成部分,在未来的带有语义分析的搜索引擎中,语义关系发现、预测、查询以及基于
在水果收获时,采摘是最为繁琐和劳动量最大、耗时最长的日常作业。由于采摘作业的复杂性,采摘自动化在国内外都是一项比较新颖又具有挑战性的课题。目前国内水果采摘作业基本都
植物的计算机模拟是计算机图形学在自然景物造型和植物生长仿真试验上的一项重要研究与应用。至今,已经有许多植物形态模拟的建模方法被提出,其中主要的方法包括基于几何参数的
随着计算机仿真技术的发展,仿真技术越来越多地被应用到工业生产与国防科学研究中。计算机科学与计算机图形学的发展,诞生了虚拟现实技术,这一技术彻底地把科研人员从枯燥的
在现代软件开发中,软件建模的重要性日渐提升。系统越大、越复杂,建模的重要性就越大。UML是用来对软件系统进行可视化建模的一种语言,UML建模工具是使用UML进行可视化建模的软
门户可以将各种异构应用和数据资源集成到同一用户界面下,并根据用户或角色的不同,形成个性化访问页面,进而实现信息的有效传递。门户作为信息集成与发布的有效手段已经获得了广
随着web2.0互联网产品模式的兴起,具有交互、开放、分享等特性的社交产品得到了普及。微博作为一个集创造、传播及分享信息于一体的平台,成为当代人们发表言论,分享信息,获取资源