论文部分内容阅读
近年来,随着公共领域安全事故频发,不法分子利用可燃液体危害社会,因此对于可燃液体的检测问题具有重要意义。拉曼光谱作为一种分子“指纹”图谱,能够根据物质分子间的振动来对需要检测的物质进行定性分析,广泛应用在物理、化学、材料等领域。拉曼光谱可应用于便携式监测系统,在保证操作安全性的同时,对物质进行准确分类,但其数据量偏大,如果不对其数据处理会大大增加后续的分析时间,影响自动识别的速度。本文运用拉曼光谱研究可燃液体的快速检测技术,结合决策树(Decision Tree,DT)、随机森林(Random Forest,RF)和支持向量机(Support Vector Machines,SVM)算法实现分类。主要研究内容和成果如下:
本文选取九种常见可燃液体90#汽油、93#汽油、97#汽油、甲醇、乙醇、乙二醇、二甲苯、叔丁醇、丙酮为样本,采集拉曼光谱数据。实验器材选择自主搭建的便携式拉曼光谱仪,拉曼探头的激发波长选用785nm,对可燃液体样品进行初步的拉曼光谱实验。
首先将实验所得的原始拉曼光谱数据进行数据预处理分析。通过对实验数据和背景荧光噪声信号产生原理的分析,求取极小值然后分段进行线性拟合对拉曼光谱图进行基线校正,并且增加周围关键值的选取。针对于滤波去噪方面,采用了db5小波变换和Savitzky-Golay滤波器的方法将拉曼光谱信号分解。db5小波变换通过对比多层可燃液体拉曼光谱信号分解的结果表明:db5小波3层信号分解去除背景噪声滤波效果最优,Savitzky-Golay滤波器数据窗口设置为9,多项式阶数设置为2,去除90#汽油样品的噪声信号效果也较好。归一化则采用Min-max标准化方法,设置光强信息分布在[0,1]范围内。可燃液体样品的拉曼光谱特征峰的提取选用非线性最小二乘算法实现高斯分峰拟合,可以准确的提取出谱峰信息。建立可燃液体拉曼数据库,为后续分类算法提供数据集。
对可燃液体样品拉曼光谱信号进行过预处理后,需要通过数据分类算法实现可燃液体样本的快速识别。本文采用了决策树、随机森林以及支持向量机算法进行样本的快速识别,首先将数据进行压缩,通过64、128、256、512以及1000点的准确率对比发现,512点的准确率最佳。选取512点的可燃液体拉曼光谱数据作为数据集,将数据集训练后对比决策树分类器、随机森林分类器以及支持向量机分类器的分类效果,然后进行评价,评价指标选用准确率和混淆矩阵,发现随机森林和支持向量机的准确率均为98.15%,决策树的准确率为96.30%,支持向量机(SVM)的混淆矩阵效果要优于决策树和随机森林,因此得出支持向量机算法分类效果更佳的结论。
运用拉曼光谱技术可准确检测出可燃液体样品的谱峰,对数据进行预处理和压缩有效提高分析速度,为后续仪器小型化提供了理论基础和技术参考。
本文选取九种常见可燃液体90#汽油、93#汽油、97#汽油、甲醇、乙醇、乙二醇、二甲苯、叔丁醇、丙酮为样本,采集拉曼光谱数据。实验器材选择自主搭建的便携式拉曼光谱仪,拉曼探头的激发波长选用785nm,对可燃液体样品进行初步的拉曼光谱实验。
首先将实验所得的原始拉曼光谱数据进行数据预处理分析。通过对实验数据和背景荧光噪声信号产生原理的分析,求取极小值然后分段进行线性拟合对拉曼光谱图进行基线校正,并且增加周围关键值的选取。针对于滤波去噪方面,采用了db5小波变换和Savitzky-Golay滤波器的方法将拉曼光谱信号分解。db5小波变换通过对比多层可燃液体拉曼光谱信号分解的结果表明:db5小波3层信号分解去除背景噪声滤波效果最优,Savitzky-Golay滤波器数据窗口设置为9,多项式阶数设置为2,去除90#汽油样品的噪声信号效果也较好。归一化则采用Min-max标准化方法,设置光强信息分布在[0,1]范围内。可燃液体样品的拉曼光谱特征峰的提取选用非线性最小二乘算法实现高斯分峰拟合,可以准确的提取出谱峰信息。建立可燃液体拉曼数据库,为后续分类算法提供数据集。
对可燃液体样品拉曼光谱信号进行过预处理后,需要通过数据分类算法实现可燃液体样本的快速识别。本文采用了决策树、随机森林以及支持向量机算法进行样本的快速识别,首先将数据进行压缩,通过64、128、256、512以及1000点的准确率对比发现,512点的准确率最佳。选取512点的可燃液体拉曼光谱数据作为数据集,将数据集训练后对比决策树分类器、随机森林分类器以及支持向量机分类器的分类效果,然后进行评价,评价指标选用准确率和混淆矩阵,发现随机森林和支持向量机的准确率均为98.15%,决策树的准确率为96.30%,支持向量机(SVM)的混淆矩阵效果要优于决策树和随机森林,因此得出支持向量机算法分类效果更佳的结论。
运用拉曼光谱技术可准确检测出可燃液体样品的谱峰,对数据进行预处理和压缩有效提高分析速度,为后续仪器小型化提供了理论基础和技术参考。