论文部分内容阅读
随着社会政治、经济和科技的高速发展,犯罪事件也以一定的速率不断增长,而且违法犯罪更具组织化、职业化和高智能化。我国公安信息系统信息化程度不高,分析研判不够智能化,决策机制有失科学性,缺乏对数据由宏观到微观的问题发现手段,如何利用数据挖掘的相关技术,充分发挥警务大数据的价值和作用,使其运用到警务工作中,提高执法效率和预防打击犯罪活动,已经成为公安信息化建设中急需解决的问题。因此本文针对大数据环境下,公安技术应用不足、备选嫌疑人众多而预测方法相对落后的问题,提出了运用支持向量机(SVM)预测犯罪嫌疑人的方法,提高侦破效率。传统的嫌疑人预测方法大都通过回归或者分类方法,对嫌疑人的可能性进行判断,这可能会导致错判的可能性。针对这一问题,本文对嫌疑人的特征进行预测,提出基于支持向量机的一种新颖的嫌疑人特征预测方法。首先,本文对支持向量机的基本原理进行介绍,在其基础上提出嫌疑人特征预测模型,并通过实验验证模型的有效性,针对大数据环境下嫌疑人特征预测问题,提出基于Hadoop的分布式嫌疑人特征预测框架。本文的研究成果主要有以下几个方面:(1)针对问题特性以及支持向量机的特点,将支持向量机算法运用到嫌疑人预测问题中。(2)提出嫌疑人特征预测模型。首先对数据进行预处理,并采用信息增益的特征选择方法进行特征选择,基于支持向量机构建嫌疑人特征预测模型,运用粒子群算法(PSO)对模型的参数进行优化,并通过实验对模型进行评估,验证其可行性。(3)提出基于Hadoop的分布式嫌疑人特征预测框架,解决海量数据嫌疑人特征预测问题。设计案件特征选择的并行化和分布式SVM的运行,并于单机的SVM进行对比实验分析,验证了Hadoop处理效率更高。本文的研究成果,不仅较好的解决了嫌疑人预测问题,也为嫌疑人预测、协助办案并提高办案效率提供了新的思路,具有一定的实际意义和借鉴价值。