论文部分内容阅读
现有的研究中,对犯罪团伙的挖掘通常是利用社交网络中社团检测的算法,例如基于社会网络分析或者基于聚类分析来挖掘犯罪团伙。这两种方法比较适用于数据量较小的犯罪团伙的发现,对于较大的数据集且未知的犯罪团伙是无法进行有效的发现和挖掘。基于以上,本文提出一种新的研究方法,通过对涉案人员属性抽取,人物画像构建以及异常子图检测相结合的方法从文本中找到异常的人物关系,即异常行为团伙。主要工作如下:首先,针对于涉案人员属性抽取的不完整性,本文对涉案当事人进行本体建模以及利用AE_PI(Attribute Extraction of the Parties Involved)涉案人员属性抽取框架进行属性信息的抽取。首先从地-事-人-行为四个纬度对涉案人员进行本体建模,构建涉案人员人物画像。然后使用本文提出的AE_PI抽取框架,即基于BERT预训练模型和规则抽取模型相结合的抽取框架,从法律的裁判文书数据中将涉案人员的属性进行抽取工作。其次,为了能够从大量文本数据中挖掘异常行为团伙,本文提出一种基于信息抽取的涉案人员异常关系挖掘框架。该框架结合人物属性抽取算法与异常子图检测算法,并且通过一系列算子的实现以及数据的处理,最后输出异常的人物关系网络,即为异常行为团伙。最后,为了证明涉案人员异常关系挖掘框架的有效性与可行性,本文基于寻衅滋事罪的裁判文书数据对该框架进行实证分析。利用开发基于本体的抽取系统,对裁判文书数据中的涉案人员信息进行抽取,以籍贯和犯罪地点属性构建地点网络,进行案例分析,从而进行验证。综上,本文结合地,事,人,行为多个纬度对涉案人员进行本体建模,同时利用本文的抽取方法从文本数据中对人物属性进行抽取,将人物领域与异常子图检测领域相结合的方法,从法律裁判文书数据中找到涉案人员的异常人物关系,即异常行为团伙。从裁判文书中已有的数据,挖掘出未知的涉案人员异常行为团伙。