面向电子政务的用户行为数据收集与预处理

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:monzad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展,人们交流和获取信息的方式都发生了很大的变化,网络成了人们主要信息来源。政府网站作为电子政府的核心,逐渐成为了政府发布相关政策、法律、信息的主流平台,公众对于政府网站的使用方式也随之发生了改变。公众希望可以通过政府网站与政府相关部门人员交流、提供自己的监督意见。我国政府大力支持电子政务的发展,经过多年的努力,我国的各级政府网站的建设也越来越好,同时积累了海量的日志数据文件。如何有效的对政府网站用户的使用数据进行收集与预处理,直接关系到其中潜在规律的挖掘结果,是一个非常值得研究的课题。  本文针对面向电子政务的用户行为数据收集与预处理进行了相关研究。首先,对国内电子政府发展历史及现状进行调查研究,分析了政府网站的职能、特点和用户体验,指出了其发展过程中存在的问题。为了解决这些实际中存在的问题,结合用户行为数据收集方法难易情况和实际需求的用户行为数据收集的颗粒度,确定了基于服务器日志的数据收集方法。实际的数据处理中,为了提高数据清洗的效率,提出了SNM(Sorted neighborhood method,临近记录排序)算法的改进算法,增加了长度过滤和对属性缺失情况的判断,提高了数据清洗的准确度和效率。针对政府网站用户行为的特点实现了用户识别、会话识别、路径完成的相关启发式算法,并对其用户识别的有效性进行了验证。  最后,实现了面向电子政务的用户行为数据收集与预处理平台的运行,对政府网站的实际运行日志数据进行了分析,得到了相应的分析,并对平台的性能进行了分析。
其他文献
随着普适计算和物联网的发展,越来越多的新设备出现在实验室环境中,如RFID、智能传感器、PDU可编程电源控制器等。这些设备在实验室原有的设备(工作设备、环境调节设备、安防设
近年来,工业界和学术界花费大量的精力来构建大型知识库(如Freebase、Yago、Probase等),因为这些知识库可以用来提升信息检索、问答系统、情感分析等任务的结果。互联网技术的发
去隔行和缩放是增强视频显示质量的典型后处理方法。传统上,通常采用视频后处理芯片或CPU实现。由于专用视频后处理芯片研发及生产成本较高,而CPU对视频数据的处理效率较低,随着
随着信息技术的不断发展,信息化已经深入到了社会政治、经济、文化、生产、生活的各个领域,计算机网络已经成为人类生活、学习、工作等各方面不可缺少的工具。然而,伴随着网络在
在集成电路工艺以及微处理器性能需求的双重推动下,多核处理器逐渐取代单核处理器成为了市场的主流,微处理器的发展进入多核时代。当今大部分多核处理器采用共享存储的结构,各处
屏幕内容通常是指由电子设备的屏幕产生的视频或图像。随着计算机、平板电脑和智能手机等设备的迅速发展,屏幕内容在远程桌面、屏幕传输和云计算等应用中发挥着越来越重要的作
随着信息技术的发展,信息检索的作用日益凸显。特别是在图像检索领域,如何从海量的图像数据中快速、准确地寻找到我们期望的图像是一个十分重要且越来越热门的研究方向。基于内
近年来,随着塔式起重机在国内应用得越来越广泛,塔式起重机驾驶员的需求量在增加,同时安全事故发生率也在提高。在培训过程中,局限于一对一培训,培训内容有限,实际操作受现场条件限
词是计算语言学研究的重要对象,但从汉语词汇语义资源的建设情况来看,目前的汉语词义描述尚缺乏有效、客观、一致的辅助手段。因此,本文深入挖掘汉语的构词特点,尝试了一条经由汉
带参并发系统广泛存在于各类计算机系统的核心模块中,验证带参系统的正确性是形式验证领域中的一个热点问题。验证带参系统的难点在于:我们可以验证带参的一个很小规模的实例,