基于本体的信息过滤研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:crystalymd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息技术高度发达的今天,存在的最大问题并不是信息的缺乏或不足,而是信息量的激增已经超出人们处理信息的能力,信息的检索和利用技术的发展相对滞后。面对共享的、日益庞大的信息资源,如何针对不同用户的信息需求为用户提供个性化的服务已经成为信息管理领域的重要研究热点之一。   信息过滤主要针对用户多样且个性化的信息需求,能够从动态变化的信息源中剔除与用户信息需求不相关的信息,然后按照相关度排列把信息推送给用户。但是在现有的信息过滤系统中,信息过滤技术都存在着一定的不足。如在基于规则的信息过滤系统中,随着规则数量的增多,对于规则的管理会变得越来越困难;在基于内容过滤的信息过滤系统中,由于缺少语义信息,系统提供给用户的信息不能很好地满足用户的需求;在基于协作过滤的信息过滤系统中,某些情况下,系统找到的相似用户并不是与当前用户兴趣最相似的用户,导致系统提供给当前用户的信息不是他最感兴趣的信息。   本体技术的出现和成熟为信息过滤技术的发展带来新的机遇。领域本体提供了人们对领域概念和概念层次的共同理解,其应用能够有效地降低人们对自然语言理解技术的依赖。在信息过滤系统中引入本体,一方面可以优化用户建模,在保证系统响应速度的前提下使用户模型和信息内容的比较更准确;另一方面可以用于信息过滤,增加对语义信息的利用,在一定程度上弥补当前信息过滤算法的不足,提高信息过滤的查全率和查准率。   本文首先对信息过滤系统的发展和现状、本体技术进行简要综述。然后从现有信息过滤系统存在的问题入手,提出一种基于本体的信息过滤系统模型,并对模型中的关键技术--用户模型创建和信息过滤算法进行分析研究。用户模型创建是本文重点,文中提出一种基于本体表示的用户模型,并介绍了一个基于本体的用户模型实例。   本文的工作和贡献主要体现在以下几个方面:第一,提出模型的形式化定义和框架表示,为进一步研究奠定了理论基础;第二,提出利用描述逻辑表示的本体理论来表达用户需求的模型,该模型可以充分表达用户需求中的语义信息;第三,对于冗长的原始文本,利用文档归并算法形成有意义的段落集合,然后把段落集合转变成一个本体树构成的森林;第四,提出了基于树形结构的相似度比较算法,可以在语义级别上比较需求本体和文档本体实例的相似性。
其他文献
随着社会经济水平的提高,人们对身体健康的关注越来越高,特别是初中生,处于身体成长阶段的他们面临着高考的压力,导致他们重视自己的文化成绩,忽视了对身体的锻炼.随着素质教
20世纪60年代以来,信息化大潮相继出现在世界的各个角落,社会已进入一个崭新的经济时代—“信息经济时代”,以微电子为基础、计算机为核心、光纤和卫星通讯为先导的信息技术的高
我国图书馆数字参考咨询从起步到目前已经经历了多年的时间,投入了巨大的资源与精力,但是业界对于数字参考咨询评价的关注并未与这项服务的实施保持同步,评价机制尚未成为整个数
学位
互联网发展到今天,虚拟社区已经成为人们进行信息交流的重要场所,社区中信息获取与信息共享活动频繁。本研究基于修正后的TAM模型,引入自我效能、认同、激励理论,将虚拟社区的信
“你不是一个人在战斗”这句话形象生动地说明了体育竞技运动中团体协作的重要性和必要性.在社会竞争越发激烈的今天,社会成员之间由于生活、工作压力大而产生了一些隔离、冷
采用液体饲喂法测定了13种药剂对橘小实蝇成虫的毒力,以及多杀霉素分别与噻虫胺、氰戊菊酯、阿维菌素混配对橘小实蝇成虫的联合毒力.结果 表明,噻虫胺、多杀霉素、氯戊菊酯对
在长跑教学中,传统的观点认为“极点”的出现是正常的生理反应,只有以顽强的意志品质克服“极点”的痛苦,才能达到耐力的提高.耐久跑不受场地条件限制,有较高的锻炼价值,本文
第一章 总则rn第一条 为了防治农作物病虫害,保障国家粮食安全和农产品质量安全,保护生态环境,促进农业可持续发展,制定本条例.rn第二条 本条例所称农作物病虫害防治,是指对
期刊
现阶段,伴随着我国社会体制建设以及经济市场建设工作进程的不断加深,教育体制改革工作正受到着越来越多人的重视.其中,职业中专作为我国教育体制建设工作中的一大重点环节,
体育不仅是一种身体运动,更是一种教育手段,一种生活方式,一种精神载体.体育是学校教育的重要组成部分,在学生的学习生活中占据着举足轻重的地位.很多学生认为,体育课会占据