【摘 要】
:
在中文对话中,大量存在着省略的现象,为了避免由于省略造成的表述模糊以及歧义等问题,本文进行了相关的研究,以中心理论作为理论依据,提出一种适用于中文对话系统或中文交互式问答
【机 构】
:
哈尔滨工业大学信息检索研究中心,哈尔滨,150001
论文部分内容阅读
在中文对话中,大量存在着省略的现象,为了避免由于省略造成的表述模糊以及歧义等问题,本文进行了相关的研究,以中心理论作为理论依据,提出一种适用于中文对话系统或中文交互式问答系统的省略恢复模型,并且通过实验验证该模型的正确性和效用性。本文选用TRECQA2004-2007的翻译语料作为实验数据集,通过省略判定,待恢复词识别以及省略恢复三个过程的处理,最终得出的实验结果准确率为68.67%,召回率为75.00%,F值为71.64%,相对于不使用中心理论方法的省略恢复模型,本文的方法在准确率及F 值上面都有较大的提升。
其他文献
随着社会经济的快速发展,我国的财政体制经过了多次改革和完善才逐渐形成了现有的财政管理制度,但是由于近些年财政管理制度暴露的问题越来越多,对国家职能部门产生了严重的
音乐教育可以陶冶学生情操,抒发情感,还可以促进学生思维方式的转变,提升学生的整体素质.高校音乐教育的核心是审美能力培养,本文主要就目前高校音乐教学中审美能力培养的重
针对中文文本信息过滤中过滤模板生成过程的非线性问题,借鉴遗传算法可以在全局范围内寻找最优解的特性,引入遗传算法解决文本分类问题,并应用一种新的基于集合论的方法证明其在
财务管理其属于医院对资金进行收集与使用以及分配等一系列财务活动的计划和协调,以及控制与考核工作的整体体系,其对于医院自身的生存和发展会产生非常直接的影响.本文主要
近些年来,在社会不断的发展和前进的背景下,我国的城市化建设在逐渐的加快,全面的提高土地资源的合理利用在新时期的土地资源管理中发挥着十分重要的作用和意义,能够实现土地
双语平行语料库是自然语言处理领域的重要资源。针对当前双语语料获取困难的现状,本文提出基于模板转换的方法对互联网上平行语料进行自动获取,采用基于转换模式数量和转换模式
Deep Web入口发现是Deep Web数据集成的关键问题之一,本文应用主题爬行技术和本体技术,构造网页分类器(WPC)、表单结构分类器(FSC)和表单内容分类器(FCC),实现特定领域Deep Web
在开放领域问题回答研究中,问题分类是首要面对的问题,也是影响问答系统性能的关键。而目前问题分类语料规模都比较小,难以满足实际应用中问题分类的需要。本文根据HOWNET 建立
若干年后自己的健康状况如何?这是人们最关心的问题之一,其实要了解这种健康的发展趋势并不难,5分钟内就可来个自我测定。请依次对下列问题一一作出选择,如果您的选择与问题
本文将信息抽取中的关系抽取技术应用于专利摘要文本,抽取专利摘要文本中技术关键词间的连接关系。本文将特征分为需精确匹配特征和需近似匹配特征两类,分别定义相似性计算方法