【摘 要】
:
为有效精确地挖掘海量数据流特征,提出采用数据集中位分割和冗余数据碎片合并的方法设计决策树并构建云平台数据特征挖掘模型。传统的云平台下数据挖掘中对碎片信息不做处理,
【基金项目】
:
国家自然科学基金项目(61364020), 校级青年课题重点项目(2012YJQN06)
论文部分内容阅读
为有效精确地挖掘海量数据流特征,提出采用数据集中位分割和冗余数据碎片合并的方法设计决策树并构建云平台数据特征挖掘模型。传统的云平台下数据挖掘中对碎片信息不做处理,使文本碎片成几何级增长,导致有用信息的丢失。通过挖掘冗余信息中符合挖掘条件的碎片特征,使用KD树进行数据挖掘索引,在迭代过程中,对数据进行层进中位分割,并结合碎片合并技术,构建数据挖掘云平台模型,对中位数进行维度匹配分箱,使数据的挖掘和传输率最大限度地得到利用。仿真实验证明了采用碎片合并的方法能有效提取冗余碎片中的有用特征信息,数据挖掘性能得到大
其他文献
“狗咬邮递员”查询是移动点最近邻查询问题的派生问题,是要找到当狗和邮递员以某种恒定速度运动时狗能最快到达的邮递员集合。与一般的移动点最近邻查询不同。“狗咬邮递员”
一、时代召唤爱国主义教育 爱国主义是“对于数千年来世代相传的自己祖国,自己人民、自己语言文学的及民族的优秀传统之热爱。”它萌芽于人类社会的孩提时代。我们的祖先随着
由于氯甲烷回收过程具有工艺过程复杂、非线性、时变性等特点,导致氯甲烷含水量难以预测。提出了ISVM软测量建模方法,鉴于新增训练样本中如果存在违反KKT条件的样本,则这些样本中肯定存在新的支持向量,必然会使支持向量集发生变化,原分类支持向量集中的非支持向量也有可能转化为支持向量,进一步提出了改进ISVM氯甲烷含水量预测模型。研究结果表明:通过与普通ISVM预测模型比较,采用改进ISVM预测模型的预测
在改革开放十余年后的今天,以建立社会主义市场经济为主要标志,一个全新的社会主义运行模式正在形成。思想政治教育怎样适应并维护新体制,建立新的机制的问题已经急迫地摆上
首先对宁波轨道交通工程1号线一期天童庄车辆段与综合基地地基钉形水泥土双向搅拌桩处理的设计、施工工艺进行介绍。经过三次试桩,确定了钉形水泥土双向搅拌桩的施工参数,并
初进大学校园时,我是个十足的书迷。痴情在“书中自有黄金屋,书中自有颜如玉”中,希翼自己能有哲学家的头脑,文学家的气质。日子虽清淡,内心倒很恬静、充实。可校园并非一尘
脑部组织的分割与提取是脑部医学图像三维重建及可视化能准确表达其相应组织部位的前提。针对脑部MRI图像数据的特点,本实验设计方法,一方面将Canny算子作用于原图像得到比原图更明确的边缘信息,并将其结果引入水平集函数中;另一方面利用阈值分割方法对原图进行分割,将其结果作为水平集方法中的初始水平集,避免了手工勾画轮廓的操作,有效地减少了由手工操作带来的分割误差。本方法将Canny算子精确定位边缘的优点
慢性前列腺炎是成年男性的常见病,属中医的“精浊”“淋证”范畴,最近几年在我国发病率日渐增高;而慢性非细菌性前列腺炎,约占慢性前列腺炎的90%以上。由于慢性非细菌性前列腺炎病
主要研究协同中继系统链路层的无线资源管理与调度问题。以单小区中继系统为模型,研究高效的中继系统资源优化分配与合作策略。结合用户接入公平性因素,将改进的层次分析法引
在我国实行社会主义市场经济体制是一场深刻的社会变革,同时也对人们的思想观念、道德观念产生了巨大的冲击,利益关系的复杂化造成人们价值选择的多样化。有的学生价值主体意