【摘 要】
:
由于Web的存在,数据量在爆炸式的不断的增长.将传统的数据挖掘方法应用到Web上成为近年来讨论的焦点.Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息.Web
论文部分内容阅读
由于Web的存在,数据量在爆炸式的不断的增长.将传统的数据挖掘方法应用到Web上成为近年来讨论的焦点.Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息.Web上各种形式的文档和用户访问信息就构成了Web数据挖掘的对象.Web上的数据具有一定的结构性,但不同于传统数据库的结构化数据,它们没有特定的数据模型,数据本身具有自我描述、动态可变和半结构化的性质.XML(eXtensible MarkupLanguage)对半结构化数据提供了良好的支持,它以标记文本格式存放数据,成为web数据交换的标准.该文主要内容有:第一,对数据挖掘和Web挖掘进行全面的介绍,包括Web挖掘的定义、过程、分类、发展以及三类Web挖掘的基本思想和关键技术,并将Web挖掘与Web信息检索作了比较.第二,初步探讨了如何使用XML将异构性、半结构化的Web数据表示成结构化的XML文档.说明了XML技术在Web数据挖掘中的重要地位和前景.第三,深入研究和探讨了Web挖掘中的预处理技术;设计并实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程.给在Web挖掘中使用传统的数据挖掘方法进行挖掘创造有利条件.
其他文献
可信恢复结合了安全操作系统的可用性和安全性需求,强调了系统失效后进行安全无损的恢复,它也是对高等级安全操作系统的重要要求。本文以SECIMOS和CAS-EARTH两个安全操作系统的
2011年松江区新浜镇完成镇村集体产权制度改革,自2012年起实行村级资产委托镇级代管.为规范集体资产管理,依托市区健全的管理机制,结合本镇实际,整合资源、统筹力量、多管齐
计算机网络有效地实现了资源共享,但资源共享和信息安全是一对矛盾体。随着资源共享进一步加强,随之而来的信息安全问题也日益突出。 课题主要解决的问题是依据PKI体系结构
当前漏洞样本来源种类繁多,样本属性大同小异,研究漏洞搜索方法与融合技术可更全面更高效地获取有价值的漏洞样本,解决样本冗余所带来的各种问题,帮助构建更完善统一的漏洞样本库
协同的移动机器人被广泛地用在商业和工业场景中完成各种任务。然而,构建多个移动机器人协同工作的系统是具有挑战性的。与传统协同应用相比,在移动机器人平台上的协同应用开
自动化技术作为一种高效稳定的系统,可以应用在每一种生产中,其可以在一定程度上提高生产效率,确保生产安全.想要提高生产效率与确保生产的安全以及人身安全,就必须应用自动
5月28日,十三届全国人大三次会议审议通过了《中华人民共和国民法典》,这是新中国成立以来第一部以“法典”命名的法律,是新时代我国社会主义法治建设的重大成果.《中华人民
近几年,嵌入式技术飞速发展,快速向各种行业深入渗透,嵌入式系统设计与应用已成为信息产业中发展最快、应用最广的计算机技术.Flash文件系统作为嵌入式操作系统的一个重要组
网络信息技术的快速发展为行业发展带来了便利.水资源作为社会发展、人们生活不可或缺的组成部分,有着十分重要的作用.但近几年,水环境受到污染,严重影响社会经济发展和生活.
建设技术管理对于建设公司开发项目具有积极的作用,能够有效地改善整体水平.在我国建设产业的发展过程中,为了顺应时代潮流,要不断变化自身管理技术,合理运用多种节能减排技