论文部分内容阅读
随着生物学的不断发展,对生物特征的观测和探索已不再局限于定性描述,而是需要借助统计方法对大批实验和考察数据进行系统整理和深入分析,建立与之相关的统计优化模型并设计算法求解,来得到更多有用的信息。由于生物特征的相关实验数据具有变量较多、维数较高等结构特点,所以应用于生物学中的常用统计优化方法大多数是多元统计优化分析方法。 本文主要涉及两种生物特征,即指纹特征和微生物含量影响因素特征。研究生物学特征的常用统计优化方法有:深度学习、非参数核密度估计方法、支持向量机方法、多元方差分析方法、多元线性回归分析方法和通径分析方法。本文分析这些常用统计优化方法的原理、应用条件、适用于解决哪类问题等,并将这些方法应用到指纹特征分布和影响土壤中微生物含量的特征因素的研究中。主要研究工作及成果如下: 1.指纹全局特征(中心点)统计建模分析研究。借助卷积神经网络由数据驱动的优势,通过大量数据建立深度学习优化模型,利用卷积神经网络算法得到指纹中心点的位置和方向信息。把学习得到的中心点特征的三维数据(x,y,θ)作为下一步进行初步分析研究的实验数据。实验结果表明:一般性指纹图像的中心点平均分布在(294,313)位置处,中心点的平均方向为88度。此部分研究使得在宏观上对指纹图像中中心点的分布有了大体了解。 2.指纹细节点分布及其对中心点和三角点依赖关系的分析研究。指纹细节点的空间分布在指纹识别研究中起着重要作用。现在的一些研究认为细节点在指纹中是不均匀分布的,但是不知道引起这种现象的原因。在本文中,描述指纹细节点的空间不均匀分布并研究引起这种不均匀分布的原因,从而达到对指纹特征进行分析研究的目的。首先,提出采用一种新的、自适应的非参数核密度估计的模型来描述指纹细节点的分布情况。其次,提出支持向量回归机模型来研究细节点的分布与奇异点(core点和delta点)的关系,并利用交叉验证的方法来说明引起细节点不均匀分布的因素的影响程度。结果表明:得到的细节点的密度分布与指纹中细节点的实际分布相吻合,即core点和delta点周围细节点分布密集,其余细节点分散分布在指纹的其他区域。细节点方向与core点方向的差异对细节点分布的影响最大。 3.影响土壤中微生物含量的特征因素的统计分析研究。利用不同降雨量下土壤中各种微生物含量的数据和不同的土壤理化指标、地理及气候、土壤上植物总量的数据通过SPSS统计学软件分别实现了多元方差分析、多元线性回归分析和通径分析方法。实验结果表明:不同降雨量下土壤中的微生物含量存在差异性;铵态氮含量和海拔高度与变形菌门含量呈显著的线性关系,且铵态氮含量对变形菌门含量所起的直接作用最大;总氮量对土壤中放线菌门含量的变化所起的负面作用最大,但铵态氮含量对放线菌门含量所起的直接作用最大。