【摘 要】
:
进入二十一世纪,计算机技术突飞猛进,随之海量的数据积累下来,这样致使以往的数据分析方法很难在大量数据集上有效的发现隐藏的信息或知识。为了解决这样的问题,数据挖掘技术
论文部分内容阅读
进入二十一世纪,计算机技术突飞猛进,随之海量的数据积累下来,这样致使以往的数据分析方法很难在大量数据集上有效的发现隐藏的信息或知识。为了解决这样的问题,数据挖掘技术的研究和应用得到重视。关联规则的发现是数据挖掘领域中的一个非常重要的研究课题。关联规则揭示了一个事务中各种属性之间同时出现的规律特性,而且它也是一种求解的知识模式。本文的研究主要包括数据挖掘应用体系结构的研究、模糊关联规则挖掘理论及其算法等。在数据挖掘系统体系结构研究方面,我们系统的分析了数据挖掘或知识发现的基本过程和系统的各部件功能。本文介绍了经典的关联规则的挖掘算法Apriori,找出了传统算法的不足,引入模糊理论来求解非布尔属性的关联规则问题。本文利用模糊概念对数据进行映射和抽象等加工,方便模糊关联规则的提取,拓展了关联规则的应用范围。设计和实现了相应的挖掘算法MFAR(Mining Fuzzy Association Rule),并在没有领域专家指导的前提下,利用See5软件提供的决策树方法评价模糊关联规则的结果。在多个数据集上的实验表明该算法可以有效地进行数据加工,最终挖掘出有意义的关联规则,取得较好的实验结果。
其他文献
随着近几年邮政业务的大力发展,邮政公司各专业局的新系统上线、员工转岗、新员工入职都需要相应的培训做为支撑。省邮政培训中心原有的事务管理信息系统已经不能满足日常工
本文对空间矢量数据索引研究及其在政府地理信息系统中的实现进行了研究。文章对常用空间索引方法进行了对比,分析了各自的优缺点,重点对R树空间索引方法进行了研究,详细讨论了R
随着信息技术的飞速发展和无线通信技术的不断进步,嵌入式系统行业逐渐发展并成熟起来,特别是目前手机市场如此红火。未来的手机发展趋势将是智能化的,它的功能将会越来越复杂,也
无线传感网通常是由具有感知、处理和无线通信功能的传感器节点自组织形成的网络。机会路由是可以应用于无线传感网的数据转发协议,该协议将数据包都转发给一组网络节点,这些节
随着Internet的发展,多媒体通信和分布式环境下的协同工作等应用促进了组播通信的发展。组播问题的关键在于组播路由的确定,即寻找简单、高效、健壮的组播路由算法。组播路由
随着多媒体技术和网络技术的迅猛发展,巨量的图像和视频信息以各种编码形式不断涌现,使得有效的图像和视频检索变得日益重要.为此,在信息学科形成了一个全新的研究领域,即基
移动数据库是为了适应移动计算环境下的数据存取需要而产生发展起来的。采用数据复制和同步技术的复制移动数据库系统是移动数据库的一种重要模型,这种模型对移动设备在断连
海洋科学数据作为我国海洋科技创新发展的战略资源,是一个可持续发展的要素。然而传统的海洋科学数据管理平台以文字、图片等资料为主,不能较好地表达海洋信息的空间位置及可视
目前,数据存储领域的很多技术还处于研究阶段,从最初的DAS(Direct Attached Storage,DAS)模式发展到现今的网络存储模式,数据存储逐渐成为人们的研究热点。传统的存储结构采用SCS
随着信息技术蓬勃发展而诞生的网络教学,凭借其信息量大、交互性强、覆盖面广等特点,在教育领域发挥着越来越重要的作用,并日益深刻地影响着教学内容、教学方法、教学模式的变革