DNA数据库数据挖掘应用研究

来源 :刑事技术 | 被引量 : 0次 | 上传用户:hqxx03447
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
始建于2003年的全国公安机关DNA数据库目前已聚集了大量数据信息,除DNA分型等技术数据外,还包括犯罪的时间、空间、类别、手段以及涉案人员的地域、民族、行为等多个维度的海量数据。将数据挖掘引入DNA数据库的应用,通过分类、估计、预测、相关性分组、关联规则、聚类分析等方法,可以实现对DNA数据库中DNA分型、人员背景和行为、案件特征等复杂类型数据的进一步挖掘。本文采用聚类分析的方法,对DNA数据库中2011~2014年采集的数据信息从犯罪的时间、空间、类别等维度进行了初步分析,共超过45万起刑事案件、超过2000万个违法犯罪人员和超过100万条通报。包括:杀人、抢劫、盗窃、强奸等4类案件的时间、空间分布;数据库中4类涉案人员的地域分布情况分析;数据库人员重复采集情况分析等。文章同时对DNA数据库应用数据挖掘技术做了SWOT分析。虽然受到基础数据条件的限制,上述分析还存在诸多不足,但是数据挖掘是一个具有广阔应用前景和富有挑战性的新兴技术,将其引入DNA数据库的管理和应用中是信息化社会开放思维的体现,也是DNA数据库面对挑战,不断自我完善和发展的一种选择。随着DNA数据库的数据总量的增长、数据覆盖范围的扩大和数据质量的提高,通过数据挖掘,联机分析处理等相对成熟的信息化手段,文中的分析模式可以在动态条件下和更深层次中实现,如基于人员、案件背景信息分析的典型犯罪行为在时空中的分布呈现、演化及预测,基于DN A和身份信息查重的高危人群与时间、空间等维度的动态关系分析和预警等。DNA数据库数据挖掘的情报产品所具有的实时性、可靠性,特别是人员身份识别的识别精准性,使其在犯罪规律研究、犯罪动态分析、公共安全管理决策等领域具有特殊的潜力和价值。
其他文献
本文介绍了美国、英国、法国和日本支持文化产业发展的财政政策与税收政策,并总结了各国政策的共性特点,在此基础上,提出了完善我国文化产业财税政策的建议。
近年来,三峡水库藻类水华频发,而传统的藻类检测方法由于分类鉴定工作量大,难以适应野外大批量样品快速准确分析的要求,因此,开展水华的快速监测和鉴定工作迫在眉睫。在藻类
基于生态足迹理论,测算了1997-2009年甘肃省在保持社会经济可持续发展下的最佳耕地资源容量,运用ARIMA模型对甘肃省2010-2015年的生态足迹和生态承载力进行预测,按照《甘肃省
<正>柯大夫:我在上次的公司体检中发现尿酸高了,这是不是意味着我得了痛风?我应该吃治疗痛风的药吗?山西刘×刘读者:高尿酸血症并不等同于痛风,一般认为,当血尿酸浓度过高时
为揭示玉米赤霉烯酮(ZEA)抑制睾丸间质细胞(Leydig cell)分泌睾酮的分子机理,实验分别从ZEA对小鼠Leydig细胞睾酮分泌的抑制作用,ZEA对睾酮合成通路中各因素的影响作用,ZEA对
加强党建工作,发挥党组织战斗堡垒作用和党员先锋模范作用,对保障和促进企业切实履行职责,带领和推动经济社会科学发展意义重大。本文从完善企业党建工作对提高企业经济效益
本文在分析税务机关绩效评估的内涵和必要性的基础上,认为我国税务机关现行绩效评估体系存在评估主体具有局限性、评估指标缺乏导向性和系统性、评估结果缺乏有效激励等问题,
<正> 溯本追源远在秦汉战国时代,《素门·奇病论》:“此人必数食甘美而多肥也,肥者令人内热,甘者令人中满,故其气上溢,转为消渴”。又《灵枢·五变篇》:“五脏皆柔弱者,善病
以M学院为例,分析了解“课程思政”视阈下内地西藏幼师班语文教学中渗透思想政治教育的现状,指出了在内地西藏幼师班语文教学中存在的三大问题。并针对问题,提出了在内地西藏
本文测定南沙红树林20个表层沉积物和33个柱状沉积物的6种重金属、28种多环芳烃,并测定了群落优势种无瓣海桑、凤眼莲和短叶茳芏的重金属含量。研究了重金属和多环芳烃的含量