论文部分内容阅读
利用方便、具有隐藏性的公共社交网络平台进行犯罪活动,形成犯罪网络,是当前国内外犯罪团伙常用手段。而如何从公共网络数据中挖掘犯罪信息,对预防和打击犯罪无疑具有价值。论文即以公共网络中犯罪网络信息的挖掘为研究对象,研究内容包括犯罪网络挖掘、核心成员分析、犯罪集团组织结构分析及信息的可视化展示。 现实中常能获取到犯罪网络的部分成员信息,可称之为犯罪子网。论文对犯罪网络的挖掘即以犯罪子网为切入点,分析方法基于图论。具体是以已获取的犯罪子网成员为训练样本,以联系密度为挖掘节点相对训练节点的重要性,同时考虑实际中存在的间接联系问题,以重心距和路径平均长度对重要性进行调整,最终以重要性为挖掘节点嫌疑及核心作用判别的依据。为使挖掘算法能适应大规模的国际级犯罪网络,论文提出了基于聚类系数分析的样本子网的提取方法,目的是提高训练样本的质量,进而提高挖掘效率和效果。论文给出了基于节点相对重要性的挖掘算法的详细实现过程。 为了进一步得到犯罪集团的组织结构,论文以社区聚类分析方法对犯罪网络进行结构分析。区别于一般聚类分析初始种子节点随机选取的方法,论文以前期分析获取的核心节点为初始种子节点,因核心节点本身所具有的局部聚集特性,可极大地提高聚类分析的效率和质量。论文对采用核心节点可能带来的社区重叠挖掘问题也给出了相应的解决方案,一是首先依联系密度和联系跳数大小对核心节点进行筛选,二是对社区划分结果进行去重叠处理。论文对聚类过程的优化,体现在适应度函数的计算综合考虑了社区聚集度和交流信息量两个因素。论文给出了聚类分析的主要设计,包括核心节点选取、适应度函数计算、重叠社区处理等。 基于雷达图清晰的辐射特性和层次性,论文最后设计了犯罪网络核心成员及组织结构的雷达图布局方式,给出了基于最小生成树的布局算法和相应的节点位置计算方法。论文给出了雷达图绘制的主要代码实现。 论文对所提出的三种算法,均以911和安然事件两个真实犯罪网络为数据源,进行了挖掘质量和布局效果验证。论文对于挖掘算法主要侧重于挖掘有效性的验证。