论文部分内容阅读
随着互联网技术的发展,信息隐藏作为网络环境中一种新的保密通信手段,其应用得到迅速发展。然而,信息隐藏技术既可被国家用于安全、可靠地传送机密信息,也可被犯罪分子用于计划和协调犯罪活动,如何对网络中传输的隐藏信息实施有效地检测已成为一个日益突出的问题。随着VoIP业务迅猛增长,基于VoIP的信息隐藏技术也逐步得到应用,研究VoIP隐藏信息的检测不但具有学术研究意义,更具有一定的现实意义和广阔的应用前景。
本文提出了两种在VoIP承载的语音帧中检测LSB隐藏信息的方法,并用软件实现了共享网络内的VoIP隐藏信息检测,这些工作对VoIP隐藏信息的检测和提取具有重要意义。本文首先对VoIP中常见的两类编码波形编码和参数编码进行了深入的分析,并总结出两种编码各自的优缺点;接着对隐写与隐写分析技术的发展现状各自分图像和音频两部分进行介绍,隐写方法中有DCT变换、小波变换和MP3steg等,隐写分析方法有RS改进方法、DIH、SPA和卡方检测等,其中重点介绍LSB隐写算法和常用的三种针对图像LSB隐藏方法的隐写分析方法;然后在分析数字语音与图像的区别基础上提出两种LSB隐写分析算法,即针对压缩语音编码方式的二次统计隐写分析算法和针对波形语音编码方式的能量统计方法,二次统计算法根据VoIP应用环境下,隐写信息不能在一个数据包发送完毕,这样造成分包传送,接收方要同步提取完整的隐写信息,必须在语音数据流中设置特征位,这些特征位的统计特征不同于其他语音数据位所表现出来的特征,借此实现对是否进行隐写作出有效的判断。该算法复杂度高适合静态线下检测,但检测准确率高;能量统计算法根据人发声的特点,即过高的能量和过低的能量取到概率都非常的少,当语音隐写后,语音能量的这种概率分布将被打破,能量均值将大于非隐写的语音能量均值,通过实验得出正常语音能量的阈值,当对可疑语音进行能量均值计算后,得到的数值大于阈值时,判断出语音数据流中含有隐写信息。能量统计算法的算法复杂度低适合实时性更强的在线检测,但检测准确率相对二次统计算法来说要低。最后为了检验两种算法的实用性,在用C++语言工程实现两种隐写分析算法的基础上开发检测软件,该软件第一步通过对共享网络内的数据进行捕获,经过协议分析后过滤出语音数据,并判断出语音数据流的应用类型,如:MSN、QQ或标准RTP语音;第二步依据VoIP语音流匹配算法识别并提取出RTP包中承载的G711、G723.1或G729A三种编码的语音数据,MSN和QQ由于采用私有协议,所以无法解析;第三步结合实际需要对以上三种语音数据的隐藏信息进行实时检测或线下检测。在线检测时为了让检测人员及时了解检测情况,本文提出了滑动窗口的概念,根据多次实验获得窗口大小和滑动步长的经验值。软件测试后的虚警率,漏警率都在可接受的范围内。软件界面简洁,使用方便,对硬件性能要求低,执行速度快且能长时间运行。
现在学术界还很少有对话音数据流的隐写与隐写分析方法的研究,市面上也无同类型的检测软件,本软件填补了该领域的一项空白,本文提出的两种隐写分析方法同样走在了学术界的前沿。