基于刑事案件法律文书的要素提取技术研究

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:hrmcttkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着司法领域内案件文本数量逐年增多,人工处理的需求量也越来越大。对海量的法律文书进行智能分析和处理,对重要的信息要素进行提取,进而辅助司法办案人员更方便地理解案情,已成为智慧司法领域研究的重要内容。其中,法律文本中命名实体的准确识别和实体间关系的抽取是要素提取的基本任务,也是对文本进一步进行句法、语义等分析与理解处理的重要基础。本文基于深度学习方法对面向中文法律文本的要素提取技术开展研究,主要工作为以下:(1)构建以涉毒类刑事案件法律文书为主体的司法命名实体标注数据集。为解决训练数据方面的问题,构建一个由法律文书组成的司法命名实体标注语料集。分析刑事案件涉毒类案件文本的书写规范特点,设计合适的实体标注规范,制作对应的语料标注工具。(2)涉毒类刑事案件中提及的毒品和具体毒品的重量,会影响量刑和定罪结果,因此毒品的信息在案情理解中至关重要。在实体识别任务中,针对刑事案件设定5类实体,即时间、地点、人物、毒品以及重量(毒品),考虑司法办案人员理解刑事案件案情的实际需求定制深度学习训练方案,采用Bi-LSTM+Attention的组合进行基于法律文书的命名实体识别。在命名实体识别结果的基础之上完善法律文书中提取出的实体(重量)与毒品实体的对应关系。加入关系抽取的研究,即在标注数据集中的两种实体:毒品和重量之间加入关系标签,经过训练好的BERT模型预测后得出两种实体关系概率,由此判定重量是否能对应上毒品。实验结果表明,利用Bi-LSTM+Attention模型进行识别的F1值达到88.34%,利用BERT进行关系抽取的F1值达到82.39%。(3)为了解决司法办案人员审阅案件时提出的类案检索需求,结合以上实验中的算法模型搭建案件信息检索系统。涉毒类案件检索系统的功能不仅有针对单一案件的信息抽取,还可以对库中已有的档案进行查询检索。司法办案人员可在系统的搜索栏按毒品和重量输入查询条件,得到检索结果后根据所需信息浏览各案件。由此满足在量刑阶段浏览相似案例是如何处理的需求。此系统可以减轻司法办案人员审阅大文本量类型案件的负担,从而更有力辅助办案人员了解案情。
其他文献
目的探讨精神分裂症患者家庭环境的影响因素.方法采用家庭环境量表中文版(FES-CV)对100例精神分裂症患者和100例正常人进行测试,对影响精神分裂症患者家庭环境的各个因素分别
在新课改背景下,我国院校数学与应用数学教学培养应用型人才,构建新型人才培养模式,有利于专业学生满足社会人才需求,强化院校专业教学效果。院校数学与应用数学革新教学工作
薪酬体系一直是企业人力资源管理的关键所在,科学合理的薪酬体系不仅关系着员工的现实利益,同时体现了一个企业整体管理水平的高低,体现着企业凝集力的大小。企业要如何改变
患者,女,25岁,1年前(2004年4月)无明显原因出现活动后四肢易疲劳,1个月以后出现左上肢无力,活动后明显,但不影响日常生活.2004年6月起左手笨拙,双下肢沉重感及发僵,以上下楼
一个城市是否具有活力与生活在这个城市中的人的行为活动具有直接的联系。在以往对城市活力的研究中,往往以土地、交通、环境等等作为指标,来探究街区中活力的高低。这些要素
教学目标:1.能借助熟悉的故事,按自己的想法新编故事。2.侧重训练通过设想故事不同结局来重新组合故事情节。3.运用鱼骨图列提纲,完善细节,并将故事情节写清楚。4.鼓励学生多
本文采用挪威DNV公司的SAFETI软件,对液氯钢瓶完全破裂的事故进行泄漏扩散模拟分析,给出了事故影响范围、不同致死率区域、氯气浓度随时间的变化情况、氯气浓度随距离的变化
泌乳素(PRL)瘤是人类最常见的功能性垂体腺瘤,女性明显多于男性,且临床上观察到孕期妇女的泌乳素腺瘤增大,变性人长期服用雌激素可以引起泌乳素腺瘤和高PRL血症.可见雌激素可
金属蛋白质是一类非常重要的生物大分子。金属离子通常与蛋白质残基上的配体形成金属配位键的形式结合在蛋白质分子上。配位键的形成极大地促进了蛋白质分子的正确折叠和稳定
自1985~1987年,我们同皮肤科合作对146例带状疱疹患者分别进行了四种治疗方法的疗效观察 (四组病人的年龄及发病情况进行了统计学处理,无显著性差异),现报告于下。一般资料 14