海量数据下不完备信息系统的知识约简算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:somlist
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向大规模的数据进行知识约简是近年来粗糙集理论研究的热点。传统不完备信息系统的知识约简是假设在初始时将所有需要处理的数据一次性地装入内存中,这明显不适合处理海量数据,更不适合处理含有缺失信息的海量数据。为此,深入剖析了带有缺失信息的数据特征,把缺失属性的值用该属性所有可能的取值表示,并结合知识约简算法中的可并行性,从属性(集)的可辨识性和不可辨识性出发,并在MapReduce框架下设计了可用来处理不完备信息系统的知识约简算法。实验结果表明,该算法是有效可行的,能够对不完备信息系统中的海量数据进行知识约简。
其他文献
在无线传感器网络(WSN)中,传统的处理方式是采用奈奎斯特技术对信号进行采样并重构,而随着信号频率的增加,应用奈奎斯特技术会使成本急剧增加,这是人们所不乐见的。针对这一问题,近年来出现一种新的技术即压缩感知技术,它能利用更少的数据和合适的重构方法得到更精确的原始信号。将稀疏贝叶斯学习(SBL)和压缩感知联合起来,形成了一种在噪声的情况下更好重建可压缩信号的方法,并进一步将这种方法应用在WSN中,可
在学生学习过程中总要运用一定的学法,学法运用得当与否对学习效果有着直接的影响.本文集中探讨了学法的客观性、优效性、可操作性、指向性等七个方面的特性.
本文首先对新形势下少儿电视节目发展存在的问题进行了简单分析,然后以此为基础提出了几点优化策略,希望可以对少儿电视节目的创新发展起到一定的借鉴作用。
在用XML(e Xtensible Markup Language)Schema校验来判断XML文档合法性的过程中,目前LIBXML2所采用的逐层遍历校验法对3层及以下嵌套效率低下,对多于3层嵌套的校验法失效。针对
随着时代的快速发展,当今世界已经进入互联网信息时代,进行县级融媒体中心建设已经成为了时代发展的必然趋势。但是通过对实际情况进行分析可以看到,我国的县级融媒体发展都
地球科学是数据密集型科学,信息检索是地学研究的必要步骤。文中针对目前主流的信息检索系统空间语义感知能力不足的问题,设计了顾及空间和语义的检索系统架构。在地学知识库的
摘要:进入新时期以来,人们的精神文化需求正在不断增长,新闻采编行业只有加快改革创新,才能为人们提供高质量的新闻服务。尤其是在信息时代背景下,传统新闻采编行业受到强烈的冲击,其面临的机遇和挑战也在逐渐增多。充分发挥信息技术的优势,实现与“互联网+”的融合,是新闻采编行业的未来发展方向与趋势。本文通过分析信息时代新闻采编圃临的机遇,探索信息时代新闻采编面临的挑战及其应对措施。  关键词:信息日寸代;新
随着信息技术的不断发展,立足于移动技术、网络技术以及数字技术这些崛起的融媒体慢慢代替了广播电视这些传统的媒体,逐渐为人民群众提供相关的媒体信息与服务。这些媒体行业
摘要:习近平总书记指出:“宣传思想干部要不断掌握新知识、熟悉新领域、开拓新视野,增强本领能力,加强调查研究,不断增强脚力、眼力、脑力、笔力,努力打造一支政治过硬、本领高强、求实创新、能打胜仗的宣传思想工作队伍。”习近平总书记强调,加强“脚力、眼力、脑力、笔力”,是对宣传思想的重要要求,他对新闻宣传工作充满期待,也为我们新闻工作者如何提高本领能力指出了方法和路径。  关键词:媒体融合;新闻工作;增强
学前教育的政策改变主要是从新媒体发展中进行变革的,从多源流理论对学前教育政策变迁影响的思路来看,政策源流、问题源流、政治源流三方面对于特定的情况下学前教育政策的变