Web日志挖掘中一种事务识别方法的改进

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:xliang677
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从 web日志中发现有用的信息是所有 web站点管理者的迫切愿望 ,但 web服务器日志的不准确导致数据准备阶段的复杂性 .在数据挖掘以往的应用领域如 POS数据库中 ,存在着具有自然特征的事务 ,而在 web日志中不但没有这种事务 ,而且还不容易通过分析得到这种事务 .本文首先描述了引用长度事务分割方法的用户浏览行为模型 ,然后针对这种模型提出了两点改进 :增加了网络延时参数和对噪音数据处理的考虑 .改进后的模型能适应网络延时较大且随时间变化的情况 ,更能够反映用户的实际浏览行为 The discovery of useful information from web logs is an urgent aspiration of all web site administrators, but the inaccuracy of web server logs leads to the complexity of the data preparation phase.In past applications of data mining, such as POS databases, , But it is not easy to find such a transaction in web log.At first, this paper describes the user browsing behavior model which refers to the length transaction segmentation method, and then proposes two improvements for this model : Added network delay parameters and noise data processing considerations.The improved model can adapt to the network delay is large and changes over time, but also to reflect the actual browsing behavior of users
其他文献
通过河势演变分析,论证了长江口徐六泾节点和白茆沙河段的治理不仅是必要的,而是十分迫切的.徐六泾节点对河势的控制作用远较江阴节点弱,白茹沙河段的河势变动仍受制于上游滩
简要介绍了多目标进化算法的研究历史分类及主要方法,并提出了今后需要研究的问题。 The history classification and main methods of multi-objective evolutionary algor
[背景]探讨MRI弥散加权成像(DWI)技术在肾良恶性肿瘤鉴别诊断中的应用价值.[病例报告]回顾性分析12例经CT检查证实和10例经手术后病理检查证实的肾血管平滑肌脂肪瘤共22例、2
为防止电动机在使用过程中因断相,短路、过载、过热、过压、欠压、堵转等原因而停止生产,因而对电动机的运行状态进行及时准确的检测,并对电动机进行相应的保护。本文就M102型电
目的帮助临床医生了解抗生素的药物不良反应,促进临床合理使用抗生素药物,保证患者用药安全、有效,合理。减少不良反应的发生有重要的意义。
本文主要从马克思劳动价值论出发论证了中国农村土地所有权和使用权分离的必然性,以及在两权分离的前提下,随着改革开放以来中国市场经济的发展,当今中国土地资源方面所面临
中成药营销策划中,常常存在着只有品类没有品牌、诉求利益点太多以及缺少技术含量等误区。而要想成功策划中成药,首先应该克服中成药市场面临的营销通病,然后利用病程细分变量,寻
以TERAYON公司的电缆调制解调器为例,对南宁有线电视台HFC网络上行通道的载噪比进行了分析,并以此确定了光接收机、放大器的上行输入电平。
通过对住宅卫生间排水管线的几种方案阐述和比较,对其优点和不足之处进行了说明,并对管材作了分析 Through the description and comparison of several schemes of residen
基于构件的软件开发方法提出了全新的开发模式,在研究与应用中都体现出多方面的理论及实践价值,能很好地保证软件功能性、开发效率、质量、可靠性和可移植性.然而在突破传统