基于非可加测度和非线性积分的数据挖掘方法探究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:lostwing56
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前加权平均方法作为一种常见的聚合工具在信息融合和数据分析中广泛应用。从数学角度看,权重是一种经典的可加测度值,加权平均则是在可加测度上的Lebesgue积分。但事实上,加权平均方法的应用只有在对应目标属性的特征属性之间没有交互性的假设成立的前提下才合适。因此,考虑特征属性交互作用的非可加测度和非线性积分模型非常有价值。本论文试图从数学理论和实践应用方面尝试对非可加测度和相关的非线性积分的数据挖掘方法进行优化和创新的探索。目的在于令基于模糊测度和非线性积分的数据挖掘算法能够有更强的模型解释能力和信息预测能力。并且,通过真实数据分析,研究这一理论在金融实践应用中的表现。  本文的主要工作如下:  (1)系统地总结归纳非可加测度和非线性积分的数学发展成果和研究现状。  (2)改进基于2-可加测度的Choquet积分多元回归模型:提出两种新的基于非可加测度和非线性积分的多元回归模型:基于上下积分的多元回归模型和基于上下积分约束的Choquet积分多元回归模型。三种回归模型从不同角度改进了传统基于非可加测度和非线性积分的回归模型的解释能力和预测准确性。  (3)对Choquet积分在分类问题中的应用的几何特性做了深入而有意义的分析。主要从分类线与投影线L的夹角;投影方向和带符号的有效测度;分类的特征属性的单个和联合贡献等方面进行理论分析。  本文在非可加测度和非线性积分的理论和应用方面的研究都有突破,特别是将上下积分引入多元回归问题开辟了非线性积分在数据挖掘中应用的一个新方向,具有重要意义。同时,本文结合多个真实问题,结合遗传算法和伪梯度搜索法得到模型回归解,从实验角度论证了模型的有效性。
其他文献
随着互联网应用的深入,越来越多的用户希望通过搜索引擎获得特定行业的相关信息,通用搜索引擎无法有效地满足相应需求.文中主要介绍医药行业垂直搜索引擎的设计与实现.设计基
高职高专面临新时代的挑战,当前的高职高专教学中,存在定位不清、经费投入不足、高职教育的投资机制有待进一步完善、师资队伍尤其是有实践经验的教师队伍建设有待进一步强化
一种命名为Carley的创新型全数字LCoS技术有望使价格低廉、品种繁多且易于扩缩的反射器件在市场上大行其道,这些器件将造就分辨率达1 080p的低成本、宽屏高清晰度电视(HDTV).
2008年美国次贷危机引发的全球金融危机,使我国和贸易往来国企业都希望通过使用人民币进行计价和结算来规避风险。并且,人民币在与周边国家(地区)的贸易往来中已经成为主要结
当前高职高专英语教学中存在过于重视“四、六级”考试忽略了培养学习者的语言综合运用能力,课堂教学模式相对单一,教学手段落后的问题,可以通过培养学生自主学习能力、培养
由温室气体排放引发的全球气候变暖问题给国际社会发展带来了严重挑战,发展低碳经济成为世界各国可持续发展的必然选择。金融作为优化资源配置、调剂资金余缺的重要方式和手段
指数效应是指指数调整所引起的被加入或剔除的股票价格和成交量的异常反应。一般而言,被剔除指数的股票表现为价格下降和成交量上升,而调入的股票表现为价格和成交量的上升。
许多发烧友都有见异思迁的特点,愈是新颖的电路,愈是有兴趣,有一试方快的感觉。笔者偶然看到《一种不用电源变压器的扩音机——高淳放大器》一书,于是按书中介绍,自制不用电
云南省产业结构正处在升级换代的关键时期,对资源的高度依赖使得云南省的第二产业发展的可持续性受到挑战,而其作为主导产业并没有合理吸收大量的剩余劳动力,大量农村剩余劳动力
“2+3”教学模式是一种学生选修一个教学周内选择2学时的专项技术课程和3个专项竞赛课程的一种教赛合一,全程在教师的完整辅助指导下的教学模式。它能充分培养学生的团队协作