基于格代数的数据挖掘方法研究

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:mxqfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从数据中提取模式的过程,是数据库、统计学、数学和人工智能等多学科的综合技术。基于格代数的数据挖掘技术是在格代数的理论基础之上,对数据模式进行提取,然后利用学习到的知识对数据进行分类的一种学习框架,是理论完备的。 在这篇论文中,我们通过研究结合lattice和Roughsets,提出了一种新的高效的数据约简方法,在基于格的学习的基础上,吸收了粗糙集理论中属性约简的思想,采用密度估计的手段在学习中自动评价属性的重要程度,在可接受的分类精度和复杂度的情况下,同时约简行和列,得到简化的分类规则,为解决基于格的属性的泛化,及不依赖领域专家而自动估计属性的权重提供了一种途径。由于组成分类规则的属性是按照其重要程度的大小排序,因此分类过程中就可以按照规则中属性重要程度的序,逐属性的排除那些无法满足该属性约束的待分类的对象,会使分类过程随着对于规则中属性的扫描而大幅度减少待分类数据集的尺寸,从而大大提高分类效率。
其他文献
旅游行业网站具有被访问量大、客户忠诚度不高等特点,而且旅游网站上的旅游产品具有一定的隐藏性和灵活的组合性,这就导致了配置旅游产品困难,网站性能不高等问题。为了解决
本文在工业大数据和PHM的应用背景下,利用数据驱动式的分析流程对数控铣刀磨损的预测性评估方法进行了深入的研究和分析。在研究过程中,本文首先对铣削过程中采集的信号进行
自从被W3C推出以来,XML已经得到了越来越多的应用。在很多传统领域,当使用XML处理数据后都收到了意想不到的效果。论文首先对XML技术的特点、XML与传统技术的区别进行了分析,并
本文采用最小二乘支持向量机(Least Square Support Vector Machines,LSSVM)方法来解决模式识别问题.因为LSSVM只需求解一组线性方程组,内存需求少,学习速度快,并保持了传统S
随着计算机技术的发展,基于构件的软件开发逐渐成为软件开发的主流技术,它为软件的高开发费用、低生产率、不可控制的软件质量和高风险性提供了有效的解决途径。但是基于构件的
本文设计了一个应用于自行火炮武器控制系统中的图像处理系统.对于包含飞行目标的图像,进行图像处理,包括图像的滤波、图像的分割、图像的形态学修正等.首先,使用中值滤波算
本文针对目前研究较热的利用区间分析技术的全局优化方法进行了深入与细致的研究,分析了区间优化方法的优缺点,并针对其缺点提出了混合全局优化方法.主要的工作和贡献有:①充
本文在现有实时系统过载调度技术的基础上,将概率理论与任务调度结合起来,提出基于概率的调度分析方法.其最大优势是可以预测系统在指定时间段内的实时性能,用户能在概率意义
本文首先建立了一种具有原因歧义性的(实时)并发系统的形式化模型—具有原因歧义性的(实时)集束事件结构,然后提出了一种对具有原因歧义性的(实时)并发系统进行动作精化的方
数据仓库属于一个新兴的领域。它提供一套面向主题的、集成的数据存储管理机制,与组织机构的操作数据源分别维护,为统一的历史数据、综合数据的分析查询提供了坚实的平台,对信息