【摘 要】
:
网络信息的数量一直呈爆炸式的增长,而网络数据库中存储的庞大信息内容又不易被普通搜索引擎索引和检索到。因此,研究如何对网络数据库内的信息资源进行抽取和可视化表示,有助于
论文部分内容阅读
网络信息的数量一直呈爆炸式的增长,而网络数据库中存储的庞大信息内容又不易被普通搜索引擎索引和检索到。因此,研究如何对网络数据库内的信息资源进行抽取和可视化表示,有助于人们对信息资源的充分利用和揭示信息内部之间的联系。本文的主要研究内容就是对网络数据库的信息抽取和可视化表示的方法进行研究,以实现抽取系统和可视化应用功能。
论丈首先介绍了网页信息抽取和信息可视化的研究现状,分析了网页信息抽取系统中不同抽取方法的优缺点,并介绍了一些科技文献和专利的可视化分析工具的特点。
接下来,论文提出一种半自动生成包装器的信息抽取方法,通过将用户的标记信息归纳生成包装器进行信息抽取,然后将抽取信息存储到数据库。最后,进行抽取实验,验证了该方法的准确率并分析其在不同取样条件下的变化。
根据抽取出的文献和专利数据,论文使用可视化软件开发框架Prefuse对抽取数据进行可视化表示。这部分首先介绍该框架的特点和开发步骤,然后分别就专利和期刊文献两种数据类型进行可视化表示,除使用Prefuse自带的应用程序接口还添加了自定义组件以表现专利和文献数据的特征。
最后,论文对整个研究工作进行了总结,指出了不足之处并提出对下一步研究工作的建议。论文中实现的信息抽取系统和可视化表示程序在进一步完善后能有效地帮助人们对网络数据库内的信息进行分析和研究。
其他文献
本文通过美国国家科学基金会这个窗口,以美国国家科学基金会网站公布的科研项目信息作为统计资料来源,采用文献调查、统计、比较等方法,对该基金会社科部当前处在资助中的、正在
在新时期教育教学改革的大背景下,民族预科学生的个性淋漓尽致的凸显着,作为一名从事民族教育工作的体育教师,如何灵活运用教育教学的方法,既要认真负责的完成预科体育教学的
美国几大债券保险公司在几个月前或许还不为投资者所熟知,然而不断蔓延的次级债危机,最近将它们推到了资本市场的风口浪尖。股价的大幅下滑和债券评级下滑,给整个美国股市和债市带来了巨大的压力。目前,这些债券保险公司都力争获得资金注入来度过危机。 重创源于担保债券 目前,市场上的债券保险仍然为大约2万亿美元的市政债券提供担保,这在过去是一项利润丰厚的业务,并且为市政府和州政府低息借入资金提供了巨
本文采用文献资料法、调查法等研究方法对汉中市农村学校培养体育后备人才的现状展开了研究,得出如下:教师,职称结构不合理,训练主要在周内课余时间,训练和比赛都是以田径项
跳绳是体育中考的一项考试项目,与其他项目相比,跳绳的难度系数比较小,经过一段时间的联系,进步非常显著,因此,体育成绩不太突出的同学可以将着重训练跳绳项目,从而提高体育
较之传统体育教学方式的僵化死板,分层式教学法在教学过程中对每个层次的学生都有对应的教学方法,真正实现了因材施教,帮助学生更好地掌握教学内容.本文对分层教学法在高中体
在我国全面推进素质教育的今天,发展学生的综合素养成了重点关注的目标,特别是体能素质的提高.因此,要注重小学体育游戏的有效设计和合理使用,才是提高小学教育水平的保障.本
体育中考是一次评估初中应届毕业生体能素质的考试,对于中学生的高中录取,具有比较关键的影响.在如此的重要的场合下,很多学生都会出现一定程度心理紧张状态.部分学生由于过
随着社会水平的提高,素质教育的实施,目前,体操已作为一项学习技能融入到体育教育中,是体育专业的必修课程之一.通过体操练习对培养人健美的形体,形成身体的正确姿势,发展力