语义Web中RDF数据的结构分析与内容摘要

来源 :东南大学 | 被引量 : 0次 | 上传用户:dtj77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去十年里,语义Web经历了爆炸式的增长。随着语义Web中RDF数据量的增长,其结构和内容也在发生着变化。为了帮助人们了解语义Web的结构和内容,本文通过建立几种链接模型,分析其结构特征并研究其内容摘要方法。近几年,研究人员对RDF数据的结构分析与内容摘要做了大量研究,并取得了一些阶段性成果,主要集中在模式层的结构分析、本体及实体的摘要等方面。但是,无论是在大规模实例层面还是在大规模文档层面,尚未见到系统化的结构分析工作。另外,语义Web的内容摘要也面临数据规模和术语间关系展现等技术挑战,需要进一步研究。  本文对RDF数据的对象链接结构、文档链接结构、大规模内容摘要以及查询相关的内容摘要这四个问题开展深入研究,主要贡献包括:  (1)为了刻画RDF数据的对象链接结构,提出了对象链接模型,并使用度分布和连通性等指标分析其结构及演化特征。通过对语义Web大规模采样的分析发现:语义Web的对象链接结构具有无标度和小世界特征,并且随着时间的推移其对象链接结构正逐渐趋好。  (2)为了刻画RDF数据的文档链接结构,提出了文档链接模型及数据集链接模型,并使用形态结构和可达性等指标分析其结构特征。通过对语义Web大规模采样的分析发现:现阶段语义Web中RDF数据能够满足互联互访的要求,但是不同组织间数据重用较少;从本体到实例文档的链接对数据互联起到重要作用。  (3)为了快速理解大规模RDF数据集的内容,提出了一个基于主题的摘要方法。该方法利用文档与术语间的实例化矩阵,导出术语间共同实例化的关系,据此将术语聚类成主题。该方法通过选择流行的主题以及主题相关的文档构成摘要的结果。实验表明该方法对于大规模RDF数据集摘要是可行及有效的。  (4)针对在本体搜索中用户快速理解本体内容的需求,提出一种面向本体的查询相关的摘要生成方法。该方法包括术语关联图生成、极大r半径子图分解、子摘要生成和子摘要组合这四个步骤。生成的摘要能够展现术语之间的关联,并满足紧致性要求。实验表明相比于其它方法该摘要方法能更好地帮助用户理解本体的内容。
其他文献
随着无线通信技术和存储计算技术的快速发展与普及,无线传感器网络的应用范围也越来越广,提供更好的网络服务质量变得越来越重要,其中,节点部署问题一直是无线传感器网络发展研究
学位
近年来,随着遥感技术、传感器、网络技术等技术的发展,地学空间数据获取单位不同、数据量比较大、数据结构多样,并且呈现几何指数式增长。在空间信息领域,使用面向服务架构和
随着我国高等教育由精英教育转变为大众教育,高校毕业生就业形势日趋严峻。大学生就业日益困难的一个重要原因就在于就业预期偏高,且主要表现在对于薪酬的预期过高。大学生对
随着网络化信息化的不断深入与发展,企业的内部有很多信息管理系统,如办公自动化系统、客户关系系统、供应链管理系统、财务管理系统、生产管理系统等等。因为Web环境中基于B
在如今互联网普及、家庭电子产品多样化的时代,对家庭播放机的要求也日渐提高。因此,探究红光高清视盘播放机通过网络进行音视频播放势在必行。一旦播放机借助于网络获取音视频
在DAS模型中,用户的数据存储在第三方提供的数据库服务提供端并由第三方负责查询、管理,这种拥有数据库管理员权限,可以随时的访问数据库所有数据。这种情况下,数据库中敏感数据
随着社会经济和互联网技术的飞速发展,客户对产品的个性化要求不断提高,以产品为竞争基础的传统模式正逐渐被以客户为中心的新兴模式取代,细分市场进入到大规模定制时代。大
在分布式文件系统中,一个数据服务器同时要处理来自多个客户端的I/O访问请求。如果数据服务器没有足够的资源来处理所有已到达的以及即将到达的I/O访问请求,大量的I/O访问请求
人脸识别技术不仅是一个交叉性的技术,更是一个富有挑战性的难题。与其它物体相比,由于人脸有多种多样的变形,个体间的差异较大,所以人脸图像特征提取和识别过程比较复杂,而识别算