基于Web日志的数据挖掘及其在Web预取中的应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:aman25826882
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前Internet已经成为人们获取信息的一个重要途径,随着Web信息的日益增长,如何在如此大量的数据中提取有用信息成为一个重要课题。Web挖掘技术是数据挖掘技术在WWW上的应用,它从大量的WWW资源中提取出隐藏的有用信息,提高WWW的服务效率,具有十分重要的现实意义和广泛的应用前景。另一方面用户在访问Internet时,由于受限于网络带宽往往需要忍受较长的访问延时。为了缓解这种情况,出现网页预取技术,通过在用户浏览当前网页的时间内提取用户将来最有可能访问的网页来降低访问延时,提高Web服务的质量。Web日志挖掘是通过分析Web日志记录以发现用户访问Web页面的模式,其中会话识别是影响到Web日志挖掘的重要因素。基于统计特征的会话识别方法不同于传统的会话识别方法,该方法通过使用统计值来动态设定访问时间阈值来识别会话。传统的关联规则和序列模式挖掘中不能根据隐含的事务分类特征的而挖掘更有效的规则,相对支持度则可以解决该问题并可应用于Web日志挖掘的模式发现。Markov预取模型基于历史的预取模型,是对用户以往的使用记录的统计,再根据这些统计信息来决定预取。传统的Markov模型没有考虑到页面的重要程度以及网站结构对页面的预取的影响,CSM模型结合页面内容及站点结构来调整状态转移矩阵,可以获得更精确的预取结果,提高Web服务的质量。
其他文献
商品交易所资金结算系统是交通银行大连分行为增加银行竞争力,通过银行的网络系统,实现交易所、期货公司、结算银行之间的资金清算,进一步提高期货资金结算效率。银行信息化服务
目的 研究探讨藏医药糊黏贴(甲矩)技术操作规范.方法 将到本院就诊的患者中择取从2019年4月至2020年4月的肢体肿胀患者40例作为研究对象,将这40例患者按照入院的时间随机分为
目的 分析藏药浴在类风湿性关节炎临床治疗中的应用价值探究.方法 随机选择2017年6月至2019年6月在我院接受治疗类风湿性关节炎的80例患者,以随机数字表法进行分组,常规组和
目的 探讨蒙医治疗布鲁氏杆菌门诊患者的护理指导.方法 随机选取研究对象,研究时间为2018年10月至2019年10月,并抽取进行诊治的600例布鲁氏杆菌门诊患者实行蒙医护理指导,密
目的 分析中医内科治疗偏头痛的临床体会.方法 选取我院2018年6月至2019年6月收治的43例偏头痛患者进行研究,依据治疗方法的不同,将其分为参照组(21例)和研究组(22例)两组,参
目的 探讨孜马地苏润江散外敷治疗活动期风湿性关节炎的临床效果.方法 选取2019年1月至2020年2月在我院进行治疗的活动期风湿性关节炎患者220例进行观察研究,根据随机分配的
长期以来,多数县级医疗机构心电图室人员匮乏、业务发展滞后、抱怨“不受重视”的声音亦不绝于耳.我们也曾在此地徘徊多年,不知从何处进行“突围”,自2016年后我们以开展新项
目的 探究分析门诊药房发生药品调配差错的原因及应对策略.方法 从我院2017年9月至2018年9月门诊药房处方中抽选520张列为对照组,找出药品调配差错的处方,分析出现药品调配差
聚类分析,是在无先验知识无指导下进行数据分析的一种数据挖掘技术。通过先进算法的恰当采用,发掘潜藏的有价值的信息,提高数据分析和解释的质量,也为后续其它数据分析和整理
医改形势的不断变化、医疗市场形势的剧烈变革使得院科两级负责制医疗质量管理应运而生,医院自2014年开始,在5年多的实际运作中取得了良好的管理成效,院科两级管理水平得到了