论文部分内容阅读
随着互联网技术的发展和日益普及,网络为人们提供了海量的知识资源,并成为人们学习、教育、情感交流的最佳方式。网络具有数据量巨大、类型多样化、动态性、平等性和虚拟性等特点;它渗透于网络自身、网络服务和网络应用的各个层次。但是在这个庞大的网络系统中,如何快速高效地提取自己感兴趣的知识成为人们关注的热点和焦点。网络用户分析将成为网络服务的重要工具,它对提高网站服务质量,改善网络运行效率,保证网络的安全性,提供个性化服务等多个方面起到了非常重要的作用,满足了网络用户和服务提供者两方面的需求。网络用户行为的分类以及在此基础上的分析研究越来越亟待提到日程上来。本课题在用户行为分析领域中结合网络用户和用户行为分析的概念和分类方法,从数据获取的高效性以及用户行为分析的直观性两个方面,提出了一个以计算用户兴趣度为目的的用户行为分析步骤和系统架构,并介绍了系统架构中所用到的一些关键技术,包括:HTTP协议解析,数据包捕获技术,socket编程技术,数据挖掘的基本知识,以及个性化服务中基于规则的技术、基于信息过滤的技术等等。分析上网用户信息源的获取方法,以部分获取信息作为区分用户的标准,并结合数据挖掘的分类算法定义了兴趣度的计算公式,通过实际实验观察每个用户在浏览网页的过程中兴趣度的变化,值的大小能够客观地反映用户的兴趣爱好,最后简要说明了用户行为分析系统的一些实际应用。