论文部分内容阅读
耕地质量是关系到我国粮食安全和经济安全的热点问题。随着数据库技术的发展和耕地质量评价数据来源的多样化,数据库中隐藏的丰富的知识远没有得到充分的挖掘和利用。运用数据挖掘技术进行耕地质量评价,对耕地的质量与数量进行科学分析,对于土地评价方法研究,数据挖掘技术应用领域的拓展,以及我国在2020年内守住18亿亩耕地这条红线,具有一定的理论与实践意义。
本文以广东省龙川县为例,从耕地质量评价的数据准备、评价指标体系及权值制定、耕地质量等级评定入手,系统地研究了数据挖掘技术在耕地质量评价各主要环节中的应用。主要研究内容如下:
(1)耕地质量评价数据准备。
从影响龙川县耕地质量的自然因素、社会经济因素和生态环境因素中,选择海拔、地形坡度、田面坡度、地下水位、耕层质地、耕层厚度、剖面构型、pH值、有机质、道路影响度、城镇影响度、农贸市场影响度、灌溉保证率、排水条件、田块形状、人均耕地、(耕地)利用类型、(土地)利用系数、(土地)经济系数、亩均社会保障价和水土流失等作为评价指标;建立了混合型与离散型两套耕地质量评价指标体系;引进抽样技术解决了耕地质量评价中样本容量的确定,结合聚类分析的方法实现样本记录的自动化抽取。
(2)耕地质量评价指标权值确定方法研究。
运用因子分析、层次分析、模糊层次分析、灰色关联综合分析、BP神经网络模型等方法,分别制定了龙川县耕地质量评价指标的权值;在对每一种权值制定方法的优缺点进行比较分析的基础上,制定了耕地质量评价指标综合权值。研究结果表明,各种方法的合理性排序为:指标综合权值>BP神经网络模型>模糊层次分析>层次分析>灰色关联综合分析>因子分析。
(3)耕地质量等级评定方法研究。
基于无监督学习分类方法的耕地质量评价。分别对基于因子分析、层次分析、模湖层次分析、灰色关联综合分析和指标综合权值计算的指数和采用k-均值聚类分析,以及二步聚类分析、模糊综合评判和模糊聚类分析等方法对龙川县耕地质量进行无监督学习分类。研究结果表明,各种分类方法的正确率排序为:指标综合权值分析>BP冲经网络模型>模糊层次分析>层次分析>模糊综合评判>模糊聚类分析>灰色关联综合分析>二步聚类分析>因子分析。基于有监督学习分类方法的耕地质量评价。采用Fisher判别分析、Logistic多元回归分析、决策树分析、改进BP神经网络模型(以Prune算法的Prune-BP模型来比较)、径向基概率神经网络模型和支持向量机(以径向基核函数RBF-SVM模型来比较)等有监督学习分类方法对研究区耕地质量进行分类。分类的结果正确率排序表现为:Logistic多元无序回归分析>Fisher判别分析>改进BP神经网络模型>决策树分析=径向基概率神经网络模型>支持向量机。
通过本文研究,采用抽样技术解决了土地评价中样本容量确定的问题;探讨了二步聚类、关联规则、径向基概率神经网络模型和支持向量机等新方法在土地评价中的应用;通过对各种评价方法及评价结果的比较分析,归纳总结了各种评价方法的特点及应用效果。