论文部分内容阅读
大力发展精细农业已经成为农业发展的必然趋势,而杂草是制约农业发展的主要方面之一。为了通过实现除草剂的变量喷洒来解决精确除草问题,基于图像处理技术的杂草识别研究成为国内外研究的热点。在杂草识别中,识别方法的选择决定着识别结果的准确性。K近邻算法(K-nearest neighbor, KNN)因其原理简单、易于实现得到了广泛地应用。K近邻算法不需要建立模型且分类精度较高,将其应用于杂草识别,不仅复杂性较低,且识别率较高。因此,面向杂草识别的K近邻算法研究具有重要的理论与现实意义。本文讨论面向杂草识别的K近邻算法,做了如下工作:首先,图像分割和特征提取。以东北农业大学水稻试验田的水稻叶片和四种伴生杂草叶片图像为研究对象,四种杂草包括打碗花、飞廉、茼麻和藜。分割过程中采用加权平均法对图像进行灰度化处理,并采用中值滤波法对灰度图像平滑滤波;然后,采用最大类间方差法对灰度图像进行阈值分割,得二值图像;应用Roberts算子、Sobel算子、Prewitt算子、Gauss-Laplacian(LOG)算子和Canny算子对图像进行边缘检测,根据实验结果选择当σ=2时的LOG算子进行边缘检测效果较好;最后,在图像分割的基础上,提取的目标区域的颜色特征。本文提取R、G、B、H、I和S分量及其组合共14个特征,通过灰度直方图统计,选择其中8个灰度分布呈现明显差异的特征作为杂草识别的图像特征。其次,在传统K近邻算法(Traditional k-nearest neighbor, TR_KNN)的基础上,结合最大熵和I-divergence的概念提出两种改进算法——基于最大熵的改进K近邻算法(K-nearestneighbor based on Maximum Entropy, ME_KNN)和基于I-divergence的改进K近邻算法(K-nearest neighbor based on I-divergence,ID_KNN)。在TR_KNN算法中,使用欧氏距离作为距离度量函数,而欧氏距离认为各特征分量对分类的贡献是相同的,其特征权重相同。最大熵和I-divergence的概念本质上都是距离度量函数,不涉及权重系数的引入,而且这两种度量函数对特征值均为正时效果最佳,且由于植物的颜色特征均为正值,因此,用最大熵和I-divergence代替传统KNN算法中的欧氏距离,作为其距离度量函数,克服了主观因素的影响,提高了分类性能。本文采用UCI数据集和人工数据集对ME_KNN和ID_KNN的分类性能进行实验验证,结果显示,与TR_KNN比较,ME_KNN和ID_KNN在宏平均查全率、宏平均查准率、宏F1测量值和分类精度等方面均优于TR_KNN。最后,根据提取的8个颜色特征,应用TR_KNN、改进算法ME_KNN和ID_KNN分别进行水稻和杂草识别实验。实现结果显示,本文所提出的的改进算法ME_KNN和ID_KNN的最优识别率和宏F1测量值均明显优于传统KNN算法,但是通过比较发现ID_KNN的分类稳定性优于ME_KNN,因此,ID_KNN较ME_KNN和TR_KNN更适合于杂草分类。ID_KNN算法对水稻的最优识别率为93.33%,对打碗花的最优识别率为86.67%,对飞廉的最优识别率为93.33%,对茼麻的最优识别率为93.33%,对藜的最优识别率为93.33%。本文根据颜色特征,利用ME_KNN算法和ID_KNN算法成功实现水稻和四种杂草的识别,计算复杂性低,算法简单,识别率高。该研究证明ME_KNN算法和ID_KNN算法的分类性能优于TR_KNN,同时,对杂草识别和KNN算法的研究具有一定的参考意义。