论文部分内容阅读
伴随林业自动化的发展,数据挖掘技术越来越多地应用于林业信息的提取、识别和分析中,聚类分析作为数据挖掘的重要分支,成为林业自动化不可或缺的方面.本文着重研究聚类分析中的经典聚类算法——K-均值算法在规整林区立木信息处理方面的应用,测绘方式基于2D 激光扫描.K-均值算法具有简单、高效、时间复杂度低的特性,但该算法需预先确定聚类数目和初始聚类中心,针对该两方面的不足,本文首次提出利用斜率变化确定聚类数目的方法,试验对5 个不同距离下5 组立木分别进行100 次测量,结果显示错误测量次数仅为3 次,并可在试验前期通过人工方式去除,算法合理有效;其次对哈夫曼树法确定立木扫描点聚类中心的性能进行了试验分析,在5个不同距离下对5 组立木进行3 次采样,分别运用随机抽样法和哈夫曼树法确定的聚类中心进行K-均值聚类,结果显示运用哈夫曼树法立木扫描点正确聚类的概率为95.2%,而运用随机抽样法的概率仅为72.6%.