【摘 要】
:
该文以Web日志为研究对象,在挖掘算法的研究与实现、Web挖掘工具以及数据挖掘过程模型等方面作了一定工作.在挖掘算法的研究和实现方面:针对关联规则挖掘,提出了新的挖掘算法
论文部分内容阅读
该文以Web日志为研究对象,在挖掘算法的研究与实现、Web挖掘工具以及数据挖掘过程模型等方面作了一定工作.在挖掘算法的研究和实现方面:针对关联规则挖掘,提出了新的挖掘算法——纯SOL的动态数据库迭代算法.该算法利用关联规则的基本原理和关系数据库的SQL查询语法,通过不断产生动态临时表的方法来层层缩小挖掘的范围,大大提高了挖掘效率;针对路径模式挖掘,改进了用户浏览路径挖掘算法,提出了用户浏览兴趣的聚类挖掘问题,并利用基于非监督学习的动态聚类方法解决了该问题.在Web挖掘工具方面,设计并实现了关联规则挖掘的自动化工具—Web日志关联规则生成器(WLRM).该工具的核心采用了关联规则的纯SQL动态数据库迭代算法,实现了可视化挖掘以及挖掘过程的人机交互.最后针对Web挖掘的整个生命周期过程,该文提出了一个普遍适用的Web数据挖掘的多阶段处理过程模型,并针对每一阶段提出了研究的内容和方法.
其他文献
随着Internet的不断发展,如何在纷繁复杂的信息海洋中便捷地找到所需要的信息,成为一个具有较大实用价值的重要研究课题.该文力图运用软件agent技术,通过基于知识的信息采集
在数值计算上,有两类比较常用的利用不完全分解进行预优的方法:不完全LU分解预优法(ILU)和不完全QR分解预优法(IQR).由于以前提出的IQR分解预优法的一些缺点,一直到现在,实际
该文研究解非线性代数方程和加权线性最小二乘问题的基于Liapunov稳定性理论的数值方法,主要内容分两章.在第一章中,结合二分法和Steffensen加速技术,我们提出了一个新的算法
股指期货和融资融券的推出标志着我国证券市场从单边市场时代进入了双边市场时代,在做空机制的支持下,国外成熟的统计套利技术可以运用到我国资本市场中来。统计套利策略作为一
该文将从橡胶分散度统计模式识别的建立、实现和模型分析三个方面详细讨论了炭黑分散度仪的数学模型.在橡胶炭黑分散度统计模式识别模型的建立部分,尝试应用分形的思想方法建
该文利用锥上的不动点定理,主要讨论了三类多点边值问题正解的存在性.
中国房屋评估目前多采用"实用鉴定法",这种方法效率低,误差大.作者根据中国国情以及开发的实践,提出了一种"综合评定法".并以此法为主导思想做出"住宅质量评估及作价专家系统
模糊聚类理论是模糊模式识别之中一个非常重要的内容.由于聚类算法的特点,聚类有效性成了一个对聚类算法至关重要的问题, 该文系统地介绍了有关FCM算法的聚类有效性问题,对聚
中共中央《关于完善社会主义市场经济体制若干问题的决定》,是贯彻和落实党的十六大精神的重大举措,也是深化我国经济体制改革的纲领性文件。深刻领会《决定》的总体要求、
该文共分为三章,第一章主要讨论Cauchy型奇异积分在积分曲线发生滑扰动时的稳定性问题,完善了文献[58]的结果.第二章讨论了Riemann边值问题当边界曲线发生光滑扰动时解的情况