【摘 要】
:
近几十年来,随着互联网飞速发展,电子信息极速膨胀,全球信息高速流通,互联网进入到了信息冗余,繁杂,难以检索搜集的时代。如此信息爆炸,带来了互联网的新一波严峻挑战。自动
论文部分内容阅读
近几十年来,随着互联网飞速发展,电子信息极速膨胀,全球信息高速流通,互联网进入到了信息冗余,繁杂,难以检索搜集的时代。如此信息爆炸,带来了互联网的新一波严峻挑战。自动抽取有效信息的需求日益突出,信息抽取由此应运而生。然而,随着互联网数据规模不断扩大,传统信息抽取系统面临数据海量性,实效性的难题。如何在大数据,流数据中,进行有效信息的抽取,成为了学者和业界炙手可热的话题和关注点。基于此背景,本文针对信息抽取领域的重要分支——关系抽取进行算法的深入研究,提出并实现了模板匹配与神经网络混合抽取方法,创新性地提出基于词向量的高速抽取方法,并且设计了针对文本流的关系抽取框架。主要内容包括:1.针对模板匹配关系抽取方法Bootstrapping存在的缺点,优化现有模板结构单一性问题,并结合递归神经网络算法MV-RNN,提出了混合抽取模型;2.文本流是以文本为内容的流数据,该形式数据具有数据量大,流速快等特点,本文针对关系抽取在文本流场景下的应用,研究并提出了基于word2vec的词向量关系抽取方法,并分析其应用价值;3.本文最后综合所提及的关系抽取方法,针对文本流数据设计实现了具有预处理、存储检索以及关系抽取模块的流文本关系抽取框架。
其他文献
该文结合在中兴信息技术公司做课题的实际工作,详细的介绍了ISDN交换机网络侧基群速率接口的物理层和数据链路层的实现,并着重解释具体开发过程中的几个关键技术问题.
目的:探讨小鼠骨髓单个核细胞(bonemarrowmononuclearcells,BMMNCs)在体外诱导分化为肝细胞的可行性及其方法。 方法:将CCl4肝损伤小鼠的肝脏进行培养,收集上清,添加到培养液中
该文的研究目的是解决数字化单兵信息系统中士兵电台网基带处理的关键技术问题.首先,对适合于士兵电台的传输体制和系统体制进行了研究,提出了士兵电台网的无中心时分体制方
论文第一章介绍移动通信的发展概况,并对三种多址接入方式FDMA、TDMA、CDMA作一介绍.第二章着着要介绍CDMA蜂窝移动通信系统,特别是基于IS-95标准的空中接口部分,包括其基本
在新形势下,素质教育的概念和改革教育方式的更新不断加快,国家和政府对教育改革的重视日益提高.教育改革不仅应在制度上进行,而且还应在教育人员培养上进行,教师的素质提高
磁共振标记(MR Tagging)技术于90年代初被提出,作为一种有效的无创性检测手段,得到不断的研究和改进.它是针对人体软件组织(如心脏)的形变进行测量,定量分析其运动轨迹,从而
现如今,绝大部分的小学教学方法比较死板,总是一味遵循“教师讲,学生听”的教学模式,教师将课本内容生搬硬套,没有进行丝毫教学方式的改革与创新,总是直接告诉学生答案,这会
该文首先介绍了传统电力线载波通信的特点,描述了低压电力线通信和传统电力线载波通信的异同,以及国内外最新的研究进展情况.接着,文中结合国内外最新研究资料,对低压电力线
阅读是语文教学中重要的一部分,对学生语文综合能力的培养具有重要的意义.随着教育制度的不断改革,为了全面提高小学语文教学水平,我国开始重视各种实践和创新的策略研究,同