论文部分内容阅读
在以静态网页为主的Internet上,网页的访问模式基本符合Zipf定律。Zipf定律是Web缓存和内容分发技术的理论依据,即可以用少量的资源满足大多数访问的请求。但是随着网络的不断发展,静态网页所占比例越来越少,许多研究发现目前网络上许多资源的访问模式并不遵循Zipf分布。随着社会网络的不断发展,网络上与个人相关的数据越来越多。与静态网页相比,个人数据反映了用户的兴趣,爱好,读者大多是个人的社会关系。本研究收集了一些个人数据访问的负载,对其进行访问模式的分析。主要研究内容及结果如下:
⑴以个人交流为主的博客访问模式基本符合SE分布。这类网站以专业技术或者思想性内容为主,其热点仅限于小范围的兴趣相投的圈子,与非热点的博客相比,访问量差别不是很大,因此访问模式不符合Zipf分布,而是SE分布。而以新闻和娱乐为主的博客吸引了大部分人的兴趣,容易出现热点,所以符合Zipf分布。
⑵所分析的相册图片的用户访问频度符合SE分布。其原因在于相册提供了缩略图,用户只会对真正感兴趣的图片进行访问。同时,本文作者推断其他网站的图片访问频度也是符合SE分布的。
⑶博客文章和相册照片的评论数,以及社会网络网站用户创建的资源数,都符合SE分布。本文作者认为这主要是因为无论评论,还是创建资源,都需要耗费用户的一定精力,同时也从一个侧面反映了用户对资源的浓厚兴趣。
⑷社会网络网站用户的好友数,用户所加入的群组数以及群组的成员数符合SE分布。本文作者认为这主要是因为用户兴趣以及交往范围所限制而造成的。