【摘 要】
:
本文将信息抽取的过程看作是应用XPa山查询XML文档的过程;通过标记学习的方式,将语义项与DOM树的节点特征联系起来,并采用类似XPath的形式描述这种对应关系(相当于用学习来代替书
【机 构】
:
河北大学数学与计算机学院,保定,071002
论文部分内容阅读
本文将信息抽取的过程看作是应用XPa山查询XML文档的过程;通过标记学习的方式,将语义项与DOM树的节点特征联系起来,并采用类似XPath的形式描述这种对应关系(相当于用学习来代替书写查询语句)。该方法具有描述特征丰富,样本学习次数较少,查准率和查全率较高的特点。
其他文献
软件产业作为信息行业的基础和支柱产业,在2002年继续保持了健康稳定的发展态势,一方面是由于国家政策的有效引导,另一方面是企业采取了一系列积极响应、调整创新措施的结果.
本文介绍了开放式源代码的发展历史及国内外现状,着重介绍了全球各大厂商及政府针对开放式源代码的相应举措.针对我国开放式源代码发展的情况提出了一些具体的建议.
本文论述了在文献主题组织中所起的作用以及在词表补充修订中采用的若干编制技术.针对现有文摘数据库的检索特点指出增加部分先组式叙词的必要性;对叙词表动态管理维护中尚未
作者首先分析了网络环境下我国农业信息资源建设的现状和存在的问题,并结合自己的工作实践,对农业信息资源建设应遵循的原则、采取的策略和方法等进行了阐述.
观光果园以果实采摘为主,兼顾其他旅游功能。发展果园旅游观光采摘,可降低生产成本,增加收入,拓宽旅游空间,还可带动餐饮、交通、加工等行业发展。1、观光果园的布局在布局上
本文阐述了在网络环境下的一种信息技术教学模式,并介绍了以校园网作为媒介的师生交互,提供了一种网络环境下的课堂交流方式.
Looking for an escape?Or just an opportunity to daydream?Here’s a list of 6 romantic places to put on your bucket list.想找个地方去度假?或只想找个机会做白日梦?
随着我国与国际用人制度接轨步伐的加快,国家已颁布了102个职业标准,其中涉及国家就业准入的有90多个,科技情报研究作为一个从业人员众多、内容涵盖广泛的领域,也应该实行职
XML(eXtendedMarkupLanguage)语言是W3C组织提出的一个Internet上数据表示和数据交换的新标准.随着网络应用技术的飞速发展,XML由于自身的特点正在成为被众人所接受的描述和
XML作为一种自定义的数据格式,具有许多传统数据形式所不具备的特点.尤其在Internet领域,普遍认为HTML将逐步被XML所取代.XML迅猛发展的一个重要原因在于XML特有的自描述能力