数据挖掘的分类与聚类方法在用户访问行为中的应用研究

被引量 : 0次 | 上传用户:divide2058
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的蓬勃发展,用户网络行为越来越深入,通过特定工具采集用户网络行为信息越来越成熟,新兴的商业模式都需要精准定位用户的行为用以决策支撑。而以往的研究主要侧重于 Web浏览日志模式挖掘,较少针对特定商业需求,结合用户网络访问行为数据给出建议。数据挖掘的分类与聚类算法在商业环节中识别目标客户,挖掘行为偏好,寻找行为特征越来越受到重视。  本文首先对基于距离分类的KNN算法;基于回归的Logistic模型;基于决策树方法的C4.5算法、CART算法和随机森林算法结合实践进行阐述。针对统计软件无法实现的算法自行编写算法函数,并对各种方法的预测效果进行细致的评估。  其次对基于层次方法的AGNES、DIANA算法;基于划分方法的K-means、PAM、CLARA算法;基于密度聚类方法的DBSCAN算法结合实践进行阐述,重点讨论了算法实现的场景和效果评估。  最后通过实证的方法对用户访问黏性和连续访问路径两种行为,利用聚类和分类的方法挖掘用户的访问偏好和访问路径特定环节的影响因素。
其他文献
“永新暴动”显才能1927年初夏的深夜,从吉安城沿河街一幢民房里,透出一缕昏暗的灯光。灯光下,被调任为中共吉安地方执行委员会妇委主任的贺子珍,正在专心致志地修改一份妇委
涉外公证是我国公证制度的重要组成部分,但现阶段涉外公证出现下降趋势,公证机构应对当事人在新形势下的公证需求给与反馈,并不断提高公证人员的法律专业水平,提高对涉外经济
Pv_1终末电势(PTF—V_1)负值量的异常在诊断左房肥大或扩大中的价值,已受到普遍重视。本文试图以超声心动图(UCG)和x线检查为标准,与PTF—V_1负值量异常及二尖瓣P波阳性加以
新型城镇化与产业结构演化调整是建设现代化经济体系的两个重要着力点。在新的时代背景下,建设新型城镇化有了更深意义,事关亿万人民的福祉,任重而道远;产业结构演化调整是经济
界面改性涂层对调节复合材料的力学性能起到重要作用。特别是在气相渗硅(GSI)制备 Cf/SiC复合材料时,合适的界面改性涂层一方面保护C纤维不受 Si反应侵蚀,另一方面调节 C 纤
左心房心律为一罕见的房性心律失常,其特点为心电图在I导联或V_6上见有倒置的P波,部分则表现为V_1上出现钝园尖角形(dome and dart)特殊形态的P波。近来有些学者将左心房心
围小丛壳菌,一种子囊菌真菌,能引起苹果炭疽叶枯病。本研究的目的是建立和优化农杆菌介导的苹果炭疽叶枯病菌遗传转化技术体系,获得产孢与致病性变异的突变体,为开展该菌的分
高技术产业是推动社会经济发展的重要力量,拥有高技术、高附加值等特点,具有一定的复杂性与研究价值。鉴于我国“诸侯经济”的特殊背景,我国区际间开放受到越来越多的关注。
毛细胞性白血病过去以“自血性网状内皮增生症”为人所知,推测病变细胞来自组织单核细胞系。现较普遍的看法是:此病属于与 B 淋巴细胞有关的淋巴增生性疾病,其主要根据是病
目前人们已认识到变异性心绞痛以后某些劳力性心绞痛病例的病因是冠脉痉挛,其继发症包括急性心梗、严重的室性心律失常,心脏传导阻滞、偶而猝死。本文报告1例55岁男性患者,