论文部分内容阅读
目前加权平均方法作为一种常见的聚合工具在信息融合和数据分析中广泛应用。从数学角度看,权重是一种经典的可加测度值,加权平均则是在可加测度上的Lebesgue积分。但事实上,加权平均方法的应用只有在对应目标属性的特征属性之间没有交互性的假设成立的前提下才合适。因此,考虑特征属性交互作用的非可加测度和非线性积分模型非常有价值。本论文试图从数学理论和实践应用方面尝试对非可加测度和相关的非线性积分的数据挖掘方法进行优化和创新的探索。目的在于令基于模糊测度和非线性积分的数据挖掘算法能够有更强的模型解释能力和信息预测能力。并且,通过真实数据分析,研究这一理论在金融实践应用中的表现。 本文的主要工作如下: (1)系统地总结归纳非可加测度和非线性积分的数学发展成果和研究现状。 (2)改进基于2-可加测度的Choquet积分多元回归模型:提出两种新的基于非可加测度和非线性积分的多元回归模型:基于上下积分的多元回归模型和基于上下积分约束的Choquet积分多元回归模型。三种回归模型从不同角度改进了传统基于非可加测度和非线性积分的回归模型的解释能力和预测准确性。 (3)对Choquet积分在分类问题中的应用的几何特性做了深入而有意义的分析。主要从分类线与投影线L的夹角;投影方向和带符号的有效测度;分类的特征属性的单个和联合贡献等方面进行理论分析。 本文在非可加测度和非线性积分的理论和应用方面的研究都有突破,特别是将上下积分引入多元回归问题开辟了非线性积分在数据挖掘中应用的一个新方向,具有重要意义。同时,本文结合多个真实问题,结合遗传算法和伪梯度搜索法得到模型回归解,从实验角度论证了模型的有效性。