个人网络数据访问模式研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:houhao88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在以静态网页为主的Internet上,网页的访问模式基本符合Zipf定律。Zipf定律是Web缓存和内容分发技术的理论依据,即可以用少量的资源满足大多数访问的请求。但是随着网络的不断发展,静态网页所占比例越来越少,许多研究发现目前网络上许多资源的访问模式并不遵循Zipf分布。随着社会网络的不断发展,网络上与个人相关的数据越来越多。与静态网页相比,个人数据反映了用户的兴趣,爱好,读者大多是个人的社会关系。本研究收集了一些个人数据访问的负载,对其进行访问模式的分析。主要研究内容及结果如下:   ⑴以个人交流为主的博客访问模式基本符合SE分布。这类网站以专业技术或者思想性内容为主,其热点仅限于小范围的兴趣相投的圈子,与非热点的博客相比,访问量差别不是很大,因此访问模式不符合Zipf分布,而是SE分布。而以新闻和娱乐为主的博客吸引了大部分人的兴趣,容易出现热点,所以符合Zipf分布。   ⑵所分析的相册图片的用户访问频度符合SE分布。其原因在于相册提供了缩略图,用户只会对真正感兴趣的图片进行访问。同时,本文作者推断其他网站的图片访问频度也是符合SE分布的。   ⑶博客文章和相册照片的评论数,以及社会网络网站用户创建的资源数,都符合SE分布。本文作者认为这主要是因为无论评论,还是创建资源,都需要耗费用户的一定精力,同时也从一个侧面反映了用户对资源的浓厚兴趣。   ⑷社会网络网站用户的好友数,用户所加入的群组数以及群组的成员数符合SE分布。本文作者认为这主要是因为用户兴趣以及交往范围所限制而造成的。
其他文献
模型检测是一种自动验证有限状态系统的形式化方法。状态爆炸问题是模型检测面临的主要挑战,限界模型检测是缓和状态空间爆炸限制的手段之一。该方法通常对限界模型和性质进行
量子计算是一个方兴未艾的研究领域,普遍认为量子计算机可以解决一些经典计算中无法有效解决的问题。量子计算的发展必将对人类社会产生深远的影响。而量子线路,特别是布尔量子
RAID已经成为存储系统不可缺少的重要组成部分。RAID采用磁盘互为冗余的方法,为数据提供安全性保护。为了节约成本,更多的公司开始选择SATA系列磁盘代替FC和SCSI磁盘构建RAID系
行为识别在普适计算领域有着极大的应用前景,可广泛应用于医疗监护、智能家居/办公、商业服务等方面。其中基于传感器的行为识别因其分布范围广、不具侵扰性等优点,已成为目前
随着网络技术的发展,采用多层架构的Web应用逐渐成为重要的软件发展趋势,Web应用服务器通过简化Web应用的开发管理,已经成为多层Web应用的主流支撑平台。然而由于Web应用服务器
随着网络技术的发展与存储技术的提高,相似文本大量存在的现象越来越常见。将大规模数据中的相似文档检测出来,对于网络镜像,数据抽取,剽窃检测,垃圾邮件检测,语料库去重等有着重要
随着嵌入式DSP系统硬件的飞速发展,各种数据和控制流被应用到嵌入式DSP应用程序的计算机辅助设计中去。其中同步数据流(SDF)被广泛用于图形化的DSP设计环境。同步数据流的特点
在网络环境中,计算机系统面临的安全威胁是复杂的、多样的和动态变化的,因而,计算机系统的安全需求具有复杂性、多样性和动态变化性等特点。研究表明,多安全策略访问控制是应对复
判定两个进程是否具有某种等价关系,是形式化验证的重要组成部分,很多种等价关系被定义出来以满足不同的验证需求,强互模拟等价和分支互模拟等价是其中两个重要的两种等价关系。
基于构件的软件复用是提高软件生产率和软件质量的有效途径,是解决软件危机的重要手段之一[1],而描述构件本质特征及构件组合的构件模型是实现构件复用的关键技术。   多语