
摘要:岩石样本识别是油气勘探中的基础且重要的环节,现有的岩石样本的识别方法有重磁、测井等方法,而基于深度学习的图像识别技术并没有广泛应用于油气勘探之中。因此,本文提出一种基于深度学习的岩石样本识别方法,通过建立岩石样本自动识别分类模型以完成岩石样本的智能识别与分类,首先利用编码技术、数据增强技术和级联分类器技术对图像进行预处理,其次构造卷积神经网络(CNN, convolutional neural network)對岩石样本的进行优化训练,最后测试结果表明岩石样本识别率达到95%左右。研究思路和结果可为油气勘探岩石样本识别提供了一种新的实践思路办法,同时也为其他相关领域起到一定的理论指导意义。
关键词:卷积神经网络;数据增强技术;级联分类器
一、CNN神经网络的建立——数据集与数据预处理
卷积神经网络可以看作由特征提取和模式识别组合而成。特征提取由卷积层和池化层(子采样层)组合形成。卷积层使用卷积核对上一层的输出图像进行卷积操作,卷积核类似于图像处理中所使用的“窗口”,一个卷积核作用于一张图像,经过卷积可以得到一张特征图,卷积操作是卷积核和输入图像上相应大小的区域进行卷积运算,并以一定步长作用于整张图像,一张图像可以使用多个卷积核,提取多个特征。池化层将经过卷积的的图像进行下采样操作,去除图像的多余信息。模式识别层是传统的分类器,通常为多层感知器。图像经过卷积和降采样操作后得到原始图像的特征,将这些特征转化为一维向量的形式再通过全连接的方式作为模式识别部分的输入,使得整个网络达到识别分类的目的。图1为单张图像单个卷积核示例。
关于卷积层,假设卷积是一次移动一个像素来卷积的,那么首先我们对输入的左上角3x3局部和卷积核卷积,即各个位置的元素相乘再相加,在每个位置加上偏置得到输出矩阵S。
同理,如果输入的是对应RGB的彩色图像等多维度的图像,即是三个分布对应R,G和B的矩阵则同时输出三个矩阵,如果把上面的卷积过程用数学公式表达出来就是
其中为输入矩阵的个数,或者是张量的最后一维的维数。代表第个输入矩阵。代表卷积核的第个子卷积核矩阵。即卷积核W对应的输出矩阵的对应位置元素的值。
卷积神经网络 S 的训练类似于 BP 算法,分为前向传播和反向传播 2 个过程。
前向传播:
从训练数据集中随机选取样本(X,Yp) ,其中 X 表示待输入图像,Yp表示图像实际类别。
通过卷积神经网络的逐层计算,输出得到测试类别 Op。其中网络执行的计算为交替执行的卷积与下采样操作,输出结果可表示为
其中,表示第n层网络的激活函数,表示第n层的卷积核或下采样矩阵。表示本次迭代输入的原始图像。
反向传播:
(1)计算实际输出:与相应的理想输出的差;
(2)使用极小化误差的方法反向传播调整各权值矩阵。
对于本文中所使用的卷积神经网络中的卷积层,步长均为2,边缘填充方式均为SAME。对于池化层,步长均为2.输入层为预处理后的299x299格式图像,第一层卷积层(C1)使用11x11的卷积核,卷积核数量为36。卷积得到的36张特征图传入5x5窗口大小的池化层(P1)。P1输出后传入使用48个7x7卷积核的第二层卷积层(C2)。卷积得到的48张特征图传入3x3窗口大小的池化层(P2),第三层卷积层(C3)以P2的输出作为输入,利用64个3x3的卷积核进行卷积操作,得到64张特征图后继续进入第四层卷积层(C4),C4使用64个3x3卷积层对输入进行卷积,得到64张特征图后传入窗口大小为3x3的池化层(P3),将输出展平成一维向量后传入层宽为1024的全连接层,最后通过softmax分类器输出预测概率分布。
二、问题一实验及结果分析
1、数据集与数据预处理
题给数据集分为自然状态下岩石照片和岩石样品的照片,自然状态下岩石照片共289张,岩石样品照片共26张。每张照片的像素为4096x3000的大尺寸照片。针对问题一我们选择自然状态下照片用于训练。
为减少模型参数,降低计算量,我们将原图片压缩为500x500格式的RGB图,利用Python中的CV2和NUMPY模块对照片进行预处理,将其转化为三通道灰度图像,以便于卷积神经网络的计算。
2、级联分类器的变形和加权预测
级联分类器的策略是,将若干个强分类器由简单到复杂排列,希望经过训练使每个强分类器都有较高检测率,而误识率可以放低。当识别一张岩石图片时,首先在言照片上截取几个部分,再分别对各部分进行预测,最后的预测结果由强分类器加权得出。
其中,每张照片截取N块后,其权重为:
3、实验结果分析
为了深入了解模型对岩石类别的识别能力,分析模型识别能力和数据之间的关联,我们分别对每一个类别进行预测,得出模型对特定类别的识别能力如下。
其中,c为深灰色粉砂质泥岩,f为灰色泥质粉砂岩,对比预测结果后,我们发现灰色泥质粉砂岩几乎全部错误的识别为深灰色泥岩。针对模型无法分辨灰色泥质粉砂岩和深灰色泥岩的问题,我们先将二者的标签改为一致,再利用原模型将这两种岩质从样本中剥离出来,再重新设计新的神经网络对其进行二分类,以更好的识别这两种岩质。
参考文献
[1] 朱丹丹,王洪喜,王建华,王冠伟.基于图像处理的粗糙边缘盲孔圆度误差测量[J].工具技术,2021,55(04):91-95.
[2] 王杰,晏鹏程,何小海,滕奇志.基于深度学习的岩石薄片正交偏光图像多曝光融合算法[J].长江信息通信,2021,34(03):47-51.