论文部分内容阅读
药物与人们的生活息息相关,但是市场上充斥着大量的假冒伪劣药品。假如不慎服用假药不但不能起到治疗疾病的效果,反而会对人体产生巨大的危害。因此真假药品的鉴别有着重要的意义。近红外光谱分析技术具有分析快速、检测成本低、不破坏样本等优点,对于药品的检测非常适用。使用近红外光谱分析技术结合机器学习方法建立真假药鉴别模型,是一种药品鉴别的有效手段。自编码网络是一种典型的深度学习网络模型,它比传统的潜学习方法具有更强的表示能力。本文首先对药品的近红外光谱数据进行预处理以及白化预处理,之后利用稀疏降噪自编码网络来针对真假药鉴别问题进行建模。并将该模型与BP神经网络及SVM算法在分类准确率及算法稳定性方面进行了对比。实验结果表明对光谱的白化预处理能有效提升稀疏降噪自编码算法的分类准确率。在训练数据集样本数达到一定数量后,自编码网络相对于BP神经网络及SVM算法具有更高的平均分类准确率。并且自编码网络在算法稳定性方面也表现的更优。针对于近红外药品鉴别中的代价敏感问题。本文通过两种方式来构建代价敏感的自编码网络模型。分别是通过自编码网络与过采样SMOTE算法相结合以及通过在自编码网络的顶层的损失函数中引入代价因子的方式。在三组不平衡样本集中对两种代价敏感自编码模型进行了实验,并与代价敏感SVM进行了对比。实验表明两种代价敏感方法均可以使自编码网络模型代价敏感化,都能有效的解决药品鉴别中的代价敏感问题。针对多台光谱仪之间的模型共享问题。本文在传统模型传递方法的基础上提出一种基于动态时间规整算法(DTW)的模型传递方法。通过动态时间规整算法找到两仪器光谱波长点之间的最佳关联关系,根据得到的关联关系建立源机光谱与目标机光谱的回归方程,得到模型传递矩阵。使用两种数据集对算法进行验证,并与传统的模型传递方法DS算法、PDS算法进行比较。实验表明,使用DTW算法传递后的光谱具有更小的光谱平均差异(ARMS)。将使用不同算法传递后的目标机光谱应用于源机光谱对药品性质和玉米成分建立的PLS模型。结果表明DTW模型传递算法整体上预测均方偏差(RMSEP)更小,优于DS、PDS模型传递算法。