基于xml的web数据挖掘中内容挖掘的研究及应用

来源 :湖北大学 | 被引量 : 0次 | 上传用户:uilyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点.数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题.面向Web的数据挖掘是一项复杂的技术,由于Web数据挖掘比单个数据仓库的挖掘要复杂的多,因而面向Web的数据挖掘成了一个难以解决的问题.而XML的出现为解决Web数据挖掘的难题带来了机会,因为XML具有以下优点:1.方便、灵活2.易理解3.特定领域、行业的扩展4.结构化的数据5.XML补HTML之不足6.可表达丰富的结构7.可验证8.内容与表达的分离.本文首先简要论述了数据挖掘发展的基本情况以及当前存在的一些问题.随后,论述了数据挖掘技术的基本概念、原理.在论述了数据挖掘技术理论之后,详细论述了Web内容挖掘内容、特点、存在的问题.接着,重点讨论xml与数据库和数据转换.在研究的基础上,本文提出了一种基于xml的web数据挖掘体中内容挖掘的体系结构模型,并就此体系结构的部分进行了实验.本文最后总结了工作尚存的不足,并指出了基于xml的web数据挖掘中内容挖掘的研究及应用研究的方向、应用前景和它所面临的挑战.
其他文献
油田广泛使用的游梁式抽油机系统中,电动机带有周期性变化的负载,针对这种特殊负载的断续供电节能控制策略,目前已经得到了实际应用。但是,由于受到控制策略和处理器性能的限制,断续供电过程中,电动机转速发生大范围的波动,定子绕组中冲击电流频繁出现,这些都是有待解决的问题。为此,本文分析了变工况条件下抽油机电机系统的能量流动规律,提出了改进策略:为了解决转速问题,首先实现了对功率的直接监测,然后通过提前断电
作为自然界和人工系统中广泛存在的一类系统,多个体系统是由若干能够在邻居间相互通信的节点构成的。每个节点都有自己的演化规律,通过网络上的相互联系,最终能够完成一个共同的
本文应用简单巨系统理论建立数学模型,研究系统的演化机制。模型描述的实际情况为:传染病在被捕食者中传播,使被捕食者种群由易感类和传染类组成,传染类被捕食者由于患病更易被
地理信息系统(GIS)是融合计算机图形和数据库于一体,用来存储和处理空间信息的高新技术,它把地理位置和相关属性有机地结合起来,根据用户的需要将空间信息及其属性信息准确真
世界经济发展的历史已经雄辩地证明:技术创新是人类财富之源,是经济发展的巨大动力。在不同的经济发展阶段,技术创新都一直推动着经济的发展,尽管在各个阶段发展的方向和表现的形态有所不同。伴随着以知识为基础的经济增长时代的来临,知识密集型产业在产业结构中的比重日趋上升,知识对经济增长的贡献日益增大,知识在经济发展过程中发挥着越来越关键的作用。科学技术仍然是推动经济发展的第一生产力。 经济的高速发展给
软件演化过程是近年来软件工程领域的研究热点,Osterweil认为“软件过程也是软件”,软件演化过程作为软件过程的一个分支也可以像软件一样建模和验证。而由于软件过程的实施
随着科学技术的发展和管理观念的创新,企业盈利的更大机会来自于与原料供应商、批发商、零售商等上下游企业的相互协调和配合。为了增强竞争优势,企业纷纷将生产经营活动集中在
本文从教育成果角度对人力资本进行了理论探讨和动态分析,并对中国1995-2005年人力资本的状况进行了实证研究、科学评述及预测。同时,考察了人力资本中各要素的贡献以及教育
网络并行是近年来并行计算的一个重要方向,目前的许多研究是在并行机机群或工作站机群COW(Cluster Of Workstations)上.COW是实现并行计算的一种新主流技术,是属于分布存储的
本文首先从电磁场麦克斯韦方程组推导出涡流微分方程,并介绍了求解方程用的磁场边界条件,通过泛函、变分求极值手段把涡流微分方程转换成另一种有利于数值法求解的等价表达形式