基于条件随机场的专利摘要信息抽取研究

来源 :数字图书馆论坛 | 被引量 : 0次 | 上传用户:hubingguixuejing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利摘要是重要的情报分析数据来源,但其自然语言文本的特征,使得专利摘要的自动内容抽取具有较大难度。文章利用亚洲语言信息检索测评会议(NACSIS Test Collections for IR, NTCIR,)提供的英文专利文摘测试语料,采用文本信息抽取统计方法中的条件随机场模型,通过提取并添加有效的特征,有针对性地抽取专利摘要中表示技术和功效内容的信息,为专利的技术功效矩阵分析提供可机器自动抽取的强大支持。
其他文献
文章从元数据互操作的角度出发,提出一个适用于数字图书馆领域的资源概念模型,采用Atom连锁格式描述,希望能够利用Atom的内建特性简化数字图书馆系统之间的数据集成工作,既保证原
博物馆的管理工作对于文物的保护和博物馆的有效运行有非常重要的意义,尤其是在当今信息技术发展的如此之快,应该牢牢把握住科学的作用,采用科学的管理方法。本文主要是找出当前
蚕蛹的油脂含量约30%,主要是三甘油酯,磷脂质含量也颇高,约3%左右。在特性值方面其碘值为118,皂化值192,折射率(20℃)1.4759,酸值22—30。蚕蛹油经毛细管色谱分析脂肪酸组成为:
猫豆荚壳中含左旋多巴,测定含量为0.96%,提取收率为0.547%。
系统性红斑狼疮是一种比较常见的躯体疾病,青年女性是高发人群。现阶段轻型以及早期患者人数呈现出逐年增多的趋势,有些重症患者经过精心的护理病症会自行消失,还有些患者发病几
研究了 CF—Ⅰ细菌富集溶液中铀。对铀的最大富集量达360mg/g 干菌以上,在较短时间内可吸附溶液中98%的铀;pH、细胞生长状态、细胞膜表面电位等对其富集铀作用影响较大,pb~(2+
文章在优化、整合、更新、补充现有的各种与科技人才信息相关的分类编码的基础上,提出一套基于科技人才信息的属性特征,同时兼顾人才基本信息、知识和技能、科技活动、科研成果
部校共建,是中央加强新闻传播建设的一项重大决策,以马克思主义新闻观教育为核心、以理论与实践相结合的方式,根本目的是培养新形势下德才兼备的新闻传播人才。中共福建省委
开展党史教育是提高大学生思想政治素质的重要方式。而开发利用学校党史可以提高思想政治理论课教师队伍的综合素质,丰富大学生思想政治教育的素材,促进教育手段进一步科学化
本文对中药羌活进行了本草考证,概括了羌活的化学成分、药理等方面的研究成果,并对羌活原植物的根进行了显微观察、薄层层析分析等,为正确鉴定药用羌活提供了资料。