Web信息的区域分布及统计分析

来源 :北京大学 | 被引量 : 0次 | 上传用户:qingqing20090756
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技的飞速发展,网络已经融入了人们的生产和生活,它对社会经济发展、信息文化的传播、交流和对政府政策管理等方面已经产生了深远的影响.目前Internet里的海量信息已经远远超过T字节,我们希望探索一种方法,能统计Web里各种纷繁复杂信息,研究其中的规律和分布情况,并通过它们来指导我们进行下一步网络建设,指导人们的日常生活和实践.目前,国际上这方面的研究还非常罕见,通过尝试,我们寻找到一种用宏观统计分析来研究Web信息的方法--"基于Web的区域信息化研究"方法,旨在从宏观统计的角度出发,研究区域网络的分布和发展,并挖掘其发展的规律,同时探索互联网与经济、社会、教育、文化之间的相互关联与影响.基于Web的区域信息化研究利用Web搜索引擎搜集的网页、网页链接结构数据等信息进行多角度统计和分析,获取出诸如IP数、网站数、网页数、网页链接入度和网页链接出度等与信息化程度相关的指标,并将这些指标信息与地理区域关联起来.同时,结合地理区域的社会、经济等信息,进行综合研究,揭示区域信息化的发展情况(比如区域内的网站数、网页数等)和区域信息化发展的影响因素(如人口素质对区域信息化的影响)等.同时,通过比较不同时期的发展情况,进一步揭示区域信息化发展的趋势.该文主要阐述了基于Web的区域信息化研究的范畴,包括研究基础、基于Web的信息化指标体系、相关关键技术、区域信息化分析及服务等.
其他文献
Internet上大量的文档资源具有隐藏性,无法通过链接结构直接抓取,对它们的发现和利用是通过搜索引擎提供的界面来实现的.随着互联网的迅猛发展,如何能对互联网上的这些隐藏的
从20世纪90年代初至今,以手机、PDA和掌上电脑为代表的手持移动设备得到了日益广泛的应用,手持移动计算已经逐渐成为当今的主流计算模式之一.随着移动设备自身软硬件性能的提
通信性能是影响集群系统实际并行处理效率的关键.随着网络技术的发展,网络硬件的通信能力迅速提高,而软件协议发燕尾服则相对滞后,导致协议开销逐渐成为通信的瓶颈.针对这种
针对企业用户的具体需求,就目前工业现场过程控制的现状及其未来发展趋势,提出了一个行之有效的小型集散控制系统(Distributed Control System)的设计研发方案.为此,本文以集
在Internet之上提供Video on demand(VoD)服务是一个很有挑战性的问题.困难存在于两个方面.首先由于视频流的高带宽需求和比较长的传输时限对于端到端的网络传播来说是一个考
在过去的几年时间里,对等网络(Peer-to-Peer Network,简称P2P)迅速成为计算机界关注的热门话题这一.P2P是网络计算一种新技术,这种技术的目的就是将网络中不同的计算机连接在
近年来的WEB服务和网格技术的发展,极大的促进了各种分布式系统的发展.分布式环境中的移动计算正迅速在现实中被广泛应用.移动代码就是指那些可以在除了代码来自的主机以外的
随着Internet和无线互联网的蓬勃发展,信息推送系统(SDI)正越来越成为人们方便、即时地获取信息的强有力工具.典型的,它是将数据流信息发送到无线用户的必由桥梁.在Internet
IP Anycast作为一种新兴的网络服务和IPv6的新特性,具有广阔的应用前景.目前它处在研究的初期阶段,几乎没有被实现.该文的目标是研制一个基于IPv6的域内主机Anycast原型系统.
JPEG2000是一种新兴的基于小波技术的图像压缩标准[TM01,RJ02,IT00],由于其出色的压缩率,很快成为许多数字图像应用领域的首选方案.随着数字图像应用的日益广泛,图像压缩算法