论文部分内容阅读
本论文研究来源于国家社科基金项目:网络社区环境中基于领域本体的用户兴趣模型与个性化知识服务研究(08CTQ009)。
随着信息技术的发展,特别是因特网应用的普及,出现了“信息爆炸”的问题,即信息非常丰富而知识相对匮乏。如何有效地解决信息过载和信息迷失带来的种种问题,如何满足各种用户不同的个性化需求等,是研究人员面临的新课题,个性化服务已经成为当前信息服务领域的研究热点之一。用户兴趣建模技术作为个性化服务的核心问题,主要是研究如何有效地组织用户的兴趣源,用户兴趣的表示、更新以及存储等。本文通过间接行为相关性分析,结合用户的显著行为,得到了兴趣度估计的最小浏览行为组合。然后结合传统的多元线性回归模型,提出了基于用户驻留时间的非线性化和页面访问速度的归一化相结合的用户兴趣度估计模型。实验验证这种建模方法能提供较为精确有效的用户兴趣描述。
本文主要完成了以下几个方面的研究工作:
1)对当前的个性化服务系统进行了分类研究,指出个性化服务系统的特点和实质。分析了其核心技术即个性化推荐技术和用户建模技术及其目前国内外研究状况,以及现存个性化服务系统的不足。
2)分析浏览行为与用户兴趣度的关系,阐明通过浏览行为估计用户兴趣度的依据,并对浏览行为进行划分,指出间接行为是用户兴趣度估计的主要行为来源。通过对用户的间接行为进行相关性分析,找出间接行为的代表行为组合,得到浏览行为的最小组合,为兴趣度估计中间接行为的选择提供一个科学的依据和原则。
3)基于最小浏览行为组合进行用户兴趣度估计,对基于最小浏览行为组合的兴趣度估计进行了形式化描述,介绍了目前各个领域用于行为分析的主要方法,特别是对传统多元线性回归分析方法进行了剖析,指出了该方法的几点不足之处,并针对性地提出了相应的改进方法,即引入基于用户驻留时间的非线性化和页面访问速度的归一化相结合的用户兴趣度估计,再利用传统的多元线性回归模型得到一个总的行为兴趣度模型。
4)针对本文提出的用户兴趣建模方法,通过实验证明其捕获用户的兴趣并以此进行个性化推荐具有较好的效果。通过综合量化集成用户不同行为体现出的兴趣度,得到更为全面、客观、准确的行为兴趣度量化估算方法。上述取得的研究成果,在用户兴趣建模和个性化推荐领域中具有很好的学术参考价值和较好的应用价值。
本论文研究提出的用户兴趣模型,可以用于用户个性化信息服务领域、客户信息管理、电子商务、以及数据挖掘领域。