K-近邻相关论文
现实世界中收集的数据集通常是含有缺失的,为了在不完备数据集上构建有效的机器学习模型,需要对数据集进行清洗。为了确保较好的清洗......
信息技术的快速发展使各行各业产生了大量有用或无用的数据,因此数据的挖掘与分类变得日益重要起来。面对爆炸性增长的数据,人们需......
在多标签分类问题中,一个实例可能同时属于多个类别(或标签)。实际的电能质量扰动往往是复合扰动,多种扰动可能同时存在,所以电能质量......
人脸识别是模式识别、图像处理等学科的一大研究热点,是利用计算机分析人脸图像,从而提取出有效的识别信息,用来辨认身份的一门技术。......
认知科学的研究表明,感知信息对自然语言习得有重要的辅助作用。由于机器不能独立地把词汇和感知世界进行关联,因此出现了Grounded......
学位
个性化信息服务旨在解决按照用户的需求传递信息的问题。随着信息科学与技术的发展,信息已经渗透到人们生活的各个方面。移动电话的......
1975年,Shamos和Hoey利用计算机有效地计算了平面点集的Voronoi图,并发表了一篇著名的论文,计算几何从此诞生,成为计算机科学理论......
如何在浩若烟海而又纷繁芜杂的文本信息中获取最有效的信息是信息处理的一大任务。文本自动分类是实现这个任务的重要方法之一。在......
三维点云数据在影视游戏、逆向工程及文物保护与展示等各个行业的应用越来越广泛。囿于外界不可控变量、设备物理误差等因素,由测......
k-近邻(KNN)算法是一种简单而有效的分类算法。传统的KNN分类算法存在着参数k难以确定以及分类新数据时间耗费大的两个缺陷。kNN模......
文本分类技术可以用来帮助人们从海量的信息中获取有用信息,它已经得到了广泛地研究和应用。文本分类就是将一些未知的文本与预先......
现实世界中存在着大量无类标的数据,如医疗图像数据、网页数据、视频数据等。在大数据时代,这种情况更加突出。标注这些无类标的数......
基因芯片技术同时可以检测成千上万个基因的动态表达水平,这些表达值构成了基因表达谱数据。肿瘤的基因表达谱具有高维小样本的特......
可解释性是数据挖掘领域的研究热点,当数据处理结果具有可解释性时才能为决策者提供一种透明的指导作用。公理模糊集(Axiomatic Fu......
频谱感知是认知无线电的前提,具有重要的理论研究价值。在实际的感知过程中,认知用户按照一定规则分布在二维空间中,各个认知用户......
[目的]基于局部密度的LOF算法时间复杂度高,且容易将处于簇边缘的正常对象误判成异常对象,INFLO算法引进反向k-近邻解决LOF算法这......
本文提出了一种学习权值算法以改进K-NN(K-NearestNeighbor)分类算法的分类准确率。从数学意义上讲,这种权值学习相当于欧氏空间中......
压缩近邻(CNN:Condensed Nearest Neighbors)是Hart针对K-近邻(K-NN:K-Nearest Neighbors)提出的样例选择算法,目的是为了降低K-NN......
局部离群因子(LOF)是对过程数据的局部离群程度的定义,然而工业过程对数据异常检测的实时性要求高,要求出所有采样点的离群因子计......
对提出的基于马氏距离的点匹配方法进行了理论分析与实验验证,针对马氏距离及加权图转换匹配方法的不足,将马氏距离融入到加权图转换......
基于一级结构信息预测蛋白质热稳定性,对于利用计算机筛选热稳定性蛋白具有重要意义.本文采用κ-近邻算法从序列出发预测蛋白质的......
从序列出发预测水解酶亚家族类型具有重要意义.本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类......

