论文部分内容阅读
在钻探工程中,岩石可钻性是用于表征岩石破碎难易程度,并对其做出定量划分的一个重要概念。岩石可钻性受岩石的物理力学性质、钻探技术条件和钻探工艺等因素的影响,是一个多变量函数。对可钻性等级的具体划分虽然基础却十分重要,岩石可钻性是决定钻进效率的基本因素,是合理选择钻进方式、钻头类型和设计钻进参数的依据。
对于可钻性分级方法的研究,国内外已有很多成果。但复杂的测试方法和条件在一定程度上限制了可钻性分级方法的推广使用。为了使岩石可钻性的分级方法具有更好的推广性,本文引入了一种在统计学习理论基础上发展起来的机器学习方法—支持向量机。从岩矿学的角度出发,运用岩石的矿物组成及结构特性等岩石矿物特性,计算预测硬度、研磨性等岩石的表面性质。从本质上研究岩石矿物性质和岩石表面性质之间的关系,进而为岩石可钻性分级提供可靠的判据。
本文建立模型的数据来自于全国范围内收集到的岩石,并对其进行的矿物性质、岩石表面性质两个方面的性能测试。矿物性质方面,通过对岩样进行表观性质描述、薄片鉴定和X-射线衍射法分析,对其矿物组成、矿物结构、矿物结晶程度、粒径等矿物参数进行了详细的分析,并获取了相应的岩相图谱;岩石表面性质方面,通过试验得到了岩样的研磨性和硬度两方面的数据资料。
本文建立模型的理论基础在于支持向量机技术。该技术是针对本次建模试验数据有限、离散、不规律等特点而选择的一种利用小样本建立高精度模型的方法。支持向量机的核心是通过非线性变换,简化计算量,提高模型训练效率;引进核函数实现点积运算,打达到高维空间向低维空间转化的目的,实现问题全局最优解的输出。这种综合了Mercer定理、稀疏解和松弛变量等多项技术的支持向量机,采用结构风险最小化原则,通过权衡小样本信息在模型中的复杂性与模型推广泛化能力,使模型达到最优效果。
在数据基础和理论基础均具备的条件下,模型建立时选取了77组试验数据作为模型训练样本,19组试验数据作为模型验证样本。经过对比分析得知,影响岩石可钻性主要内在因素为石英含量、石英粒度、长石含量和长石粒度,而主要外在因素为研磨性和硬度。模型设计为以内在因素为输入量,以外在因素为输出量。基于MATLAB平台的用户交互界面,包括模型操作、参数优选、评价指标和模型动态实时显示4个模块,使模型的建立和结果显示在同一个界面中,便于建模过程中参数的选择和结果的分析。
为了使模型具有良好的预测效果,文中着重对影响模型优劣的支持向量机参数进行了优选,包括核参数σ和惩罚因子c。其中核参数σ用于反映训练样本数据的分布,控制模型回归曲线的光滑程度。惩罚因子c用于调节模型复杂度和模型训练误差二者间的平衡关系,协调模型的拟合精度和模型的预测能力。在数据规范化和降维的基础上,模型设计以复相关系数R2作为预测模型优劣的评价指标。在此基础上,通过对比分析交叉验证法、遗传算法和粒子群优化算法,三种方法下模型的精度,优选支持向量机参数。经过计算分析最后得到预测精度最高的作为岩石研磨性预测模型(abrasiveness.mat)和岩石硬度预测模型(hardness.mat),复相关系数R2分别达到89.21%和97.40%。
为了对比预测结果,还运用Excel软件,在[0,1]规范化的基础上,将96组试验数据进行了多元回归分析,分别得出回归方程的复相关系数R2分别为71.83%和83.51%。实践表明,支持向量机方法在拟合预测岩石表面性质方面,比一般的多元回归分析结果更准确,预测结果更贴近实测值。结论表明运用支持向量机,建立岩石表面性质预测模型,是一种可行、有效的方法。
通过分析研磨性和硬度性质的预测结果,可以得出结论:硬度模型的预测精度比研磨性的高。对于硬度模型,预测精度较均衡稳定;对于研磨性模型,存在个别误差较大的组数。分析原因,可能是岩石的胶结类型对研磨性的影响较大,导致研磨性的预测误差较大。针对此类问题,将在后续的研究中进一步深入探讨。