模式识别中特征提取若干问题的研究

来源 :北京大学 | 被引量 : 0次 | 上传用户：wubingsen

【摘要】

：

随着计算机技术的飞速发展，模式识别技术越来越广泛地应用在各项日常生活中。通过测量得到的原始输入特征一般维数都非常高，一方面特征之间的相关性非常复杂，难以得到真正有用的

【作者】

：

杨成

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2009年期

【关键词】

：

模式识别特征提取主成分分析线性判别分析核函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机技术的飞速发展，模式识别技术越来越广泛地应用在各项日常生活中。通过测量得到的原始输入特征一般维数都非常高，一方面特征之间的相关性非常复杂，难以得到真正有用的信息，另一方面带来了“维数灾难”的问题，造成了分类处理时间费用的巨大消耗，使得分类器设计更加困难。为了有效地设计分类器实现分类识别，我们需要对原始数据进行变换，去除噪声和冗余，获得少量最能反映分类问题本质的，便于机器处理的有效特征。　　本文首先对特征提取方法研究现状进行了总结，然后介绍了读博期间在线性特征提取算法设计、核方法、非线性特征提取等方面的研究成果，主要贡献概括如下：　　 1.提出了一种自适应的线性特征提取方法。主成分分析和线性判别分析是目前应用最为广泛的特征提取算法，其中主成分分析以最小化重构误差为目标，但它没有考虑样本的类别信息；线性判别分析通过最大化类间散度和类内散度的比值来寻找最优的投影方向，但是它也存在一些局限，比如所提取特征数量受样本类别数目限制以及小样本问题等。为了解决这些问题，人们提出了基于Margin最大化的方法。在这些方法中，Margin用来衡量特征的分类能力，通过最大化所有Margin的和来得到特征。在本文中，我们研究了Margin的性质，引入Adaboost方法的思想，提出了一种逐步最大化Margin的方法。在我们的方法中，所提取到的特征能自适应地强调处于类别边缘的样本，更多的样本能获得较大的Margin，从而使得问题具有更好的可分性。我们在一些常用数据库上验证了算法的有效性。　　 2.建立了两种利用核函数进行非线性特征提取思想之间的等价性。线性特征提取方法具有深厚的理论基础和简单的实现方法，但是实际中我们面临的问题都包含有复杂的非线性关系。核方法是目前解决非线性问题的一个有效途径，很多优秀的线性方法都可以嵌入到所映射的核空间中，从而得到相应的非线性算法。但是，核空间是一个隐式空间，我们只能通过核函数来计算核空间中两个向量的内积，并不知道这个特征空间的具体形式，同时核函数需要满足Mercer条件来保证这个隐式特征空间的存在性。Kernels as Features思想是另外一种利用核函数处理非线性问题的方法，它利用核函数将样本非线性映射到一种显式特征空间，每个样本的特征可以用核函数和样本表示出来。我们研究了这两种利用核函数进行非线性扩展的关系，建立了线性特征提取算法经过这两种非线性扩展后得到的算法之间的一种特殊等价关系。这对于更好地理解核方法和利用核函数设计非线性算法具有较大的意义。

其他文献

高性能RFID读写器的软件设计与实现

RFID（Radio Frequency Identification）技术利用射频信号进行非接触式双向通信，通过读写器与标签之间的信息传递，实现目标识别和数据交换的目的。随着RFID技术的不断发展和进步，RF

学位

射频识别射频识别读写器读写器基带信号基带信号解码算法解码算法防碰撞算法防碰撞算法软件开发软件开发

TS流实时复用技术的研究及其软件实现

随着计算机和通信技术的进步，数字图像通信已经成为一个发展的趋势，自从ISO/IEC制定的MPEG-2成为实际的多媒体工业标准后，方方面面的视频音频产品如雨后春笋般的发展起来，而其中

学位

TS流TS流实时复用实时复用数字图像通信数字图像通信MPEG-2标准MPEG-2标准软件开发软件开发COM组件COM组件

基于自适应不等差错保护和码率优化分配的联合信源信道编码研究

无线通信和多媒体通信技术的发展改变了人类的生活，下一代移动通信的目标是实现无所不在的高速率、高质量的多媒体移动传输。然而无线信道中有限的带宽、恶劣的信道条件以及各

学位

图像传输图像传输不等差错保护不等差错保护信源编码信源编码信道编码信道编码码率优化分配码率优化分配自适应系统自适应系统

自适应人工免疫网络k-means聚类算法研究

数据挖掘是指从数据库中发现隐含的、新颖的、对决策有潜在价值的知识和规则的过程，已经在许多领域得到了广泛的应用。聚类分析是数据挖掘领域最为重要的技术之一，至今已在理论

学位

数据挖掘K-均值聚类算法人工免疫网络自适应聚类中心

天线方向图可控的多用户MIMO下行传输技术研究

由于可以在衰落信道环境下提供比传统的单天线系统更高的频谱利用率、更强的抗衰落能力以及更优越的误码性能，多输入多输出(MIMO)系统在过去的十年中得到空前迅猛的发展。目前

学位

天线方向图多输入多输出系统下行传输

静态与动态掩蔽声对小鼠下丘神经元声反应的前掩蔽效应

自由声场刺激条件下，采用一定间隔的双声刺激模式(前一个声音为掩蔽声，后一个声音为探测声)，记录昆明小鼠(Km)下丘(IC)神经元的声反应。探测声频率为神经元的特征频率(CF)，掩蔽声

学位

掩蔽声下丘神经元动态范围掩蔽效应声反应

两种AtCBL蛋白参与拟南芥响应低钾胁迫调控的遗传、细胞与分子生物学证据

钾是植物生长发育所必需的大量元素之一，在植物的生命活动中起非常重要的作用。植物细胞通过其膜上的各种K通道和转运体蛋白转运K进出细胞，但这些通道和转运体的分子调节机制迄

学位

拟南芥蛋白参与CBL1CBL9CIPK23AKT1低钾胁迫调控

数字化单级电子镇流器的研究与设计

在以“节约能源，绿色照明”为主题的今天，节能省电的电子镇流器也就越来越受到人们的关注。随着国家对照明节能工程的重视，目前节能照明产品得到了大面积的推广应用，电子镇流器作

学位

单级电子镇流器单片机功率因数输出功率

HARQ系统中的码率兼容LDPC码设计

在HARQ系统中,需要根据信道状态动态地选择编码速率,以提高无线通信的吞吐率,而固定码率的编码方式不能满足系统的需要,码率兼容LDPC码可以根据信道状态自适应的改变码率,是

学位

码率兼容LDPC码HARQ系统动态范围网络结构

单次脑电(EEG)中N170成分的检测方法的研究

近年来，脑-机接口（Brain Computer Interface，BCI）技术得到了快速的发展，研究群体和组织也迅速壮大。脑-机接口技术是通过采集和分析人脑生物电信号，在人脑与计算机或其它电子设备

学位

脑机接口脑电N170成分共空域模式支持向量机二次判别分析人脸识别

模式识别中特征提取若干问题的研究

其他学术论文