基于数据增强与深度学习的暗网流量检测与分析方法研究

来源 :陈吉祥 | 被引量 : 0次 | 上传用户:dfsdasdas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着匿名通信技术的不断发展和人们隐私保护意识的日益增强,人们访问匿名网络的趋势正逐渐上升。然而,Tor(The Second-Generation Onion Router)、I2P(Invisible Internet Project)、Freenet等暗网匿名通信工具作为搭建匿名通信的桥梁,其复杂性和高度隐蔽性极大保护了使用者的隐私,也成为暗网中违法犯罪分子隐匿其行踪的工具。面临暗网中的非法活动威胁,亟需对暗网流量进行追踪溯源以加强网络监管。近年来,基于机器学习与深度学习的暗网流量检测与分析方法已逐渐取代传统的检测方法,效率与准确度得到大幅提升。虽然现有暗网流量检测与分析方法的研究已取得一定进展,但仍存在以下问题:1)暗网流量在海量网络流量中数量极为稀少,不平衡的数据分布给暗网流量追踪溯源的准确性带来了困难与挑战;2)现有网站指纹攻击方法存在封闭世界场景下准确度低的问题,而开放世界场景下需要加入大量非监控网站样本训练攻击模型,不仅增加训练开销,且泛化能力较差。针对以上两个问题,本文的主要工作和贡献如下:1)针对暗网流量样本稀少而难以检测的问题,本文提出了一种数据增强算法CDBC(Chebyshev Distance-based Between-Class Learning),并将其用于暗网流量检测。CDBC通过计算小样本的近邻选取互异样本对,进而生成类间样本及标签以增强小样本的分类边界,有效提高了分类器的检测性能。基于多种机器学习分类模型,实现了 99.99%的暗网流量检测准确率和99.34%的暗网应用类型流量检测准确率;2)针对现有网站指纹攻击方法准确度低和泛化能力弱的缺陷,本文提出了一种基于深度学习的网站指纹攻击方法 DRFP(Deep Learning and Reconstruction-based Website Fingerprinting Attack)。DRFP基于卷积神经网络和自编码器结构增强监控网站的样本表示能力,在封闭世界下的一个无防御和两个有防御数据集上的准确率分别达到了97.92%、90.39%和60.66%;DRFP基于极值理论和开放集识别思想提高了模型的泛化能力,在训练集中不含非监控网站样本的情况下,在开放世界下的一个无防御数据集和两个防御数据集上达到了 95.18%、84.51%和51.96%的真正率,超过了主流网站指纹攻击模型。
其他文献
<正>核心素养的研究非常重要,随着国家对核心素养的重视,如何将核心素养落实在初中教学中也是一个需要研究的问题。初中语文教师要从课堂入手,培养学生的核心素养。近年来,我国教育部强调核心素养发展的观念。核心素养指的是学生在学校接受教育的过程中慢慢培养出有利于终身成长所需具备的品格和能力。在初中语文教学中不断培养拥有内涵的高素质人才是当务之急,初中语文核心素养的培养要以人为本,强调基础能力的培养。本文主
期刊
经济全球化推动着资源、资本、生产要素等的全球化,同时也推动着外籍人口的跨国流动,我国北京、上海、广州、成都等地国际化大都市的地位也越发明显。在广州的外籍人跨国流动中,非洲籍群体尤为居多,他们随着经济资本的全球流动在广州聚居,从事跨国就业和国际商贸,在推动广州国际经济贸易的同时,来穗非洲人面临着生活、住房、教育、商贸等经济上的适应问题,这些经济适应问题随着全球化进程的加快不断凸显。本研究基于普特南的
学位
自新课程改革实施以来,传统的初中语文教学模式逐渐显露出越来越多问题,十分不利于学生核心素养的有效培养,阻碍了初中语文教学工作的进步和创新。基于核心素养下的初中语文教学模式,顺应新课改要求,将语文核心素养内涵融入教学活动中,从引入生活源泉、创新教学方法、构建翻转课堂、深入家校合作等方面,多措并举提升语文课堂的核心素养教育水平,充分体现初中语文课程教学意义。
期刊
为了确保幼儿教学效率及教学质量的稳步提升,在幼儿园课程游戏化的背景下,教师应当在游戏活动中加强自身与幼儿之间的互动与交流,使师生之间能够形成一种更为和谐的关系,充分激发幼儿对学习的热情。基于此,文章首先对幼儿园课程游戏化的基本概念加以叙述,再对目前幼儿教师实施课程游戏化中存在的问题展开深入分析,最后提出幼儿园课程游戏化背景下培养良好师幼关系的具体措施。
期刊
目的随着人口老龄化加剧,我国骨质疏松症(osteoporosis,OP)的发病率连年攀升。当下急需一种方便有效且有利于大面积开展的预防措施。逆针灸作为中医治未病的典范,有简、便、效、廉的特点,具有适应国家预防OP战略的潜质。近年以来对于OP的逆灸研究有不错的成果,但对于穴位的研究不够深入,这给临床应用带来了不便。本研究以骨密度、骨小梁结构与激素水平为切入点,旨在探讨逆灸不同腧穴对去卵巢诱导的OP模
学位
<正>5月10日,中国建筑集团受邀在上海和北京分别参加2021年中国自主品牌博览会和中国智造品牌论坛暨中央企业高端装备制造创新成就展,其所属子企业中建三局自主研发的"空中造楼机"同步亮相两大活动,受到观展的国内外人士广泛关注。"空中造楼机"全称为"超高层建筑智能化施工装备集成平台",在全球首次将大型塔机和安全防护、临时消防、临时堆场等施工设备、设施直接集成于施工平台上,共用支点,同步顶升,犹如一个
期刊
<正>根据已报道的T7核酸内切酶Ⅰ序列设计引物,利用PCR合成与DpnⅠ点突变较正的方法,获得全长450bp的T7核酸内切酶Ⅰ基因。将该基因克隆到pBAD载体上,转化E.coli XL10-GOLD菌株,以L-阿拉伯糖为诱导物,分别在添加与不添加诱导物的氨苄青霉素
会议
落地式空中造楼机是一种用于高层住宅现浇钢筋混凝土施工的成套机械装备。钢结构平台作为空中造楼机的主要承载部件,在建造过程中起到模板挂载、物料转运、混凝土浇筑和施工平台等作用。本文介绍了钢结构平台桁架模块化组合、多功能施工集成、同步升降控制和防坠落保护等关键技术,分析了钢结构平台的安全性、经济性和安装便捷性。研究和示范工程建造表明,落地式空中造楼机钢结构平台能够满足平台同步升降、物料竖向与水平转运、模
期刊
<正>产业链标准化:标准化设计,模块化组合,构建产业链标准化库智能信息管控:智能数据采集与监控,实现生产智能化、信息化抗震性能优良:全现浇装配式建造,确保建筑整体抗震性能优良工程质量优良:全程机械操作、智能控制,确保工程质量毫米级建造周期可控:全程智能化、信息化管理,确保建造周期可控性减少垃圾排放:塑料模板自动开合重复利用,减少建筑垃圾产生
期刊
随着大数据技术的发展,生产生活所产生的数据量呈爆炸式增长,无论是个人还是企业,数据存储的成本越发高昂。如何提供有效可靠的数据存储备份服务是一研究热点。重复数据删除是一种用于消除冗余数据、提供可靠存储的技术,广泛应用于大型存储系统之中,但也仍存在一些不足:(1)当前基于内容分块算法存在块大小方差过大和吞吐量过低的问题;(2)基于Map Reduce的重复数据删除系统需要大量写磁盘操作,计算迭代效率较
学位