论文部分内容阅读
昆虫数量庞大,种类繁多,传统鉴定方法费时耗力,并且依赖于极少数的昆虫分类专家,存在鉴定周期长、工作量大、带主观偏见等缺陷。随着计算机科学的快速发展,自动识别技术因其处理量大、特性多、速度快、可重复性好、减少研究人员主观偏见等优点受到了较为广泛的关注。基于自动识别技术实现昆虫的快速自动鉴定具有较高的实际应用价值,例如对农业病虫害的快速鉴定是害虫防治工作的重要前提;另外,也可以为缺乏专业植保工作人员的海关、检疫站等提供昆虫快速鉴定方法,减少有害昆虫的流入。分类模型与昆虫特征提取是发展高精度、快速昆虫自动鉴定方法的两个关键问题,本文从上述两个方面对昆虫自动(?)定算法进行了研究,结果报道如下:在发展昆虫自动鉴定算法过程中,选用合适的分类模型是其关键问题之一。(?)板匹配法是早期比较经典的一种模式识别方法,其通过简单相似性实现不同类别间分类,区分能力并不明显;主成分分析,核判别分析等基于统计学的分类方法虽然一定程度地提高了分类能力,但并未获得令人满意的结果;人工神经网络作为一种机器学习方法,可以通过学习而获得昆虫差异规律,其从识别速度、适应性等方面都有了较大程度的提升,但其学习机制基于经验风险最小,是一种线性建模方法,存在过学习、易陷入局部最小等缺陷;支持向量机是基于统计学习理论发展起来的非线性机器学习方法,其基于结构风险最小,能有效防治过学习,更加适应具有非线性特性的昆虫自动识别,因此,本研究以支持向量机作为基本建模工具,构建昆虫自动鉴定模型。昆虫图像特征提取是昆虫自动鉴定模型的另外一个关键问题。提取特征的有效性直接决定了鉴定模型的识别精度,其获取的难易程度也决定了鉴定模型的鉴定速度。常见的颜色、纹理、形状等图像特征可以较为详细地表征昆虫图像,但该类特征容易受图像本身质量、光照等的影响,并且依赖于图像的预测处理效果,在当前技术下其实际应用能力受限。数学形态学以数学的方法描述并分析对象的形状,具有直观、有效、易获取的优点,受到昆虫自动鉴定领域的广泛关注。因样本异质性,提取的数学形态学特征并不普遍适用于所有类别,并且过多的特征中还可能包含冗余特征,因此,有必要进行特征筛选,不仅可以简化模型,更能提高模型的鉴定精度。基于上述昆虫自动鉴定方法,首先对属隶于绢蝶科、粉蝶科的7种蝴蝶构建了数字化自动鉴定模型。利用DrawWing软件对7种蝴蝶前翅内部翅脉交点坐标进行了自动获取,并计算各相邻交点之间的欧式距离作为数学形态特征;然后以“一对余”法构建每类样本与其他样本的二分类模型;再对每一模型经支持向量机非线性特征筛选,去除无用或冗余特征值,并以保留特征构建最终分类器,实现7中蝴蝶的自动鉴定,7个预测模型的独立测试平均精度达98.64%。将自动鉴定模型用于半翅目、鳞翅目、鞘翅目等3目19科总计34种昆虫的自动鉴定,提取昆虫的面积、周长、横轴长、纵轴长、形状参数、叶状性、球状性、圆形性、偏心率、似圆度、亮斑数等11项数学特征,在目级阶元与总科级阶元两个层次实现了34中昆虫的自动识别,均取得了较好鉴定精度。以上两个实例数据显示了新方法在昆虫自动鉴定领域具有较好的应用前景