基于刑事案件法律文书的要素提取技术研究

来源 :大连理工大学 | 被引量 : 1次 | 上传用户：hrmcttkl

【摘要】

：

随着司法领域内案件文本数量逐年增多,人工处理的需求量也越来越大。对海量的法律文书进行智能分析和处理,对重要的信息要素进行提取,进而辅助司法办案人员更方便地理解案情,

【作者】

：

张书晨

【出处】

：

大连理工大学

【发表日期】

：

2020年01期

【关键词】

：

实体识别关系抽取预训练语言模型法律文书

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着司法领域内案件文本数量逐年增多,人工处理的需求量也越来越大。对海量的法律文书进行智能分析和处理,对重要的信息要素进行提取,进而辅助司法办案人员更方便地理解案情,已成为智慧司法领域研究的重要内容。其中,法律文本中命名实体的准确识别和实体间关系的抽取是要素提取的基本任务,也是对文本进一步进行句法、语义等分析与理解处理的重要基础。本文基于深度学习方法对面向中文法律文本的要素提取技术开展研究,主要工作为以下:(1)构建以涉毒类刑事案件法律文书为主体的司法命名实体标注数据集。为解决训练数据方面的问题,构建一个由法律文书组成的司法命名实体标注语料集。分析刑事案件涉毒类案件文本的书写规范特点,设计合适的实体标注规范,制作对应的语料标注工具。(2)涉毒类刑事案件中提及的毒品和具体毒品的重量,会影响量刑和定罪结果,因此毒品的信息在案情理解中至关重要。在实体识别任务中,针对刑事案件设定5类实体,即时间、地点、人物、毒品以及重量(毒品),考虑司法办案人员理解刑事案件案情的实际需求定制深度学习训练方案,采用Bi-LSTM+Attention的组合进行基于法律文书的命名实体识别。在命名实体识别结果的基础之上完善法律文书中提取出的实体(重量)与毒品实体的对应关系。加入关系抽取的研究,即在标注数据集中的两种实体:毒品和重量之间加入关系标签,经过训练好的BERT模型预测后得出两种实体关系概率,由此判定重量是否能对应上毒品。实验结果表明,利用Bi-LSTM+Attention模型进行识别的F1值达到88.34%,利用BERT进行关系抽取的F1值达到82.39%。(3)为了解决司法办案人员审阅案件时提出的类案检索需求,结合以上实验中的算法模型搭建案件信息检索系统。涉毒类案件检索系统的功能不仅有针对单一案件的信息抽取,还可以对库中已有的档案进行查询检索。司法办案人员可在系统的搜索栏按毒品和重量输入查询条件,得到检索结果后根据所需信息浏览各案件。由此满足在量刑阶段浏览相似案例是如何处理的需求。此系统可以减轻司法办案人员审阅大文本量类型案件的负担,从而更有力辅助办案人员了解案情。

其他文献

影响精神分裂症患者家庭环境的多因素分析

目的探讨精神分裂症患者家庭环境的影响因素.方法采用家庭环境量表中文版(FES-CV)对100例精神分裂症患者和100例正常人进行测试,对影响精神分裂症患者家庭环境的各个因素分别

期刊

精神分裂症家庭环境影响因素逐步回归分析

新课改背景下数学与应用数学专业应用型人才培养模式探究

在新课改背景下,我国院校数学与应用数学教学培养应用型人才,构建新型人才培养模式,有利于专业学生满足社会人才需求,强化院校专业教学效果。院校数学与应用数学革新教学工作

期刊

新课改数学与应用数学专业应用型人才培养

A公司薪酬体系优化设计研究

薪酬体系一直是企业人力资源管理的关键所在,科学合理的薪酬体系不仅关系着员工的现实利益,同时体现了一个企业整体管理水平的高低,体现着企业凝集力的大小。企业要如何改变

学位

薪酬体系薪酬管理优化设计

[9]四肢无力1年伴言语不清3个月，左手肌萎缩1个月（上）

患者,女,25岁,1年前(2004年4月)无明显原因出现活动后四肢易疲劳,1个月以后出现左上肢无力,活动后明显,但不影响日常生活.2004年6月起左手笨拙,双下肢沉重感及发僵,以上下楼

期刊

四肢无力言语不清左手肌萎缩左上肢无力进行性加重易疲劳双下肢出现

基于微博数据的街区活力与情绪值关联度研究

一个城市是否具有活力与生活在这个城市中的人的行为活动具有直接的联系。在以往对城市活力的研究中,往往以土地、交通、环境等等作为指标,来探究街区中活力的高低。这些要素

会议

城市活力居民行为心理系统动力学因果关系微博情绪

习作《故事新编》教学设计

教学目标:1.能借助熟悉的故事,按自己的想法新编故事。2.侧重训练通过设想故事不同结局来重新组合故事情节。3.运用鱼骨图列提纲,完善细节,并将故事情节写清楚。4.鼓励学生多

期刊

合理想象丰富想象《故事新编》鱼骨图大胆想象教学设计不同结局教学重点

液氯钢瓶泄漏后果分析与控制措施

本文采用挪威DNV公司的SAFETI软件,对液氯钢瓶完全破裂的事故进行泄漏扩散模拟分析,给出了事故影响范围、不同致死率区域、氯气浓度随时间的变化情况、氯气浓度随距离的变化

会议

液氯钢瓶模拟分析应急救援预案

雌激素与垂体泌乳素腺瘤

泌乳素(PRL)瘤是人类最常见的功能性垂体腺瘤,女性明显多于男性,且临床上观察到孕期妇女的泌乳素腺瘤增大,变性人长期服用雌激素可以引起泌乳素腺瘤和高PRL血症.可见雌激素可

期刊

垂体肿瘤泌乳素腺瘤雌激素发病机制

蛋白内金属配位键的单分子力谱研究

金属蛋白质是一类非常重要的生物大分子。金属离子通常与蛋白质残基上的配体形成金属配位键的形式结合在蛋白质分子上。配位键的形成极大地促进了蛋白质分子的正确折叠和稳定

会议

金属蛋白质单分子力谱原子力显微镜金属配位键铁硫蛋白

电针与其他疗法治疗带状疱疹疗效比较

自1985～1987年,我们同皮肤科合作对146例带状疱疹患者分别进行了四种治疗方法的疗效观察 (四组病人的年龄及发病情况进行了统计学处理,无显著性差异),现报告于下。一般资料 14

期刊

带状疱疹电针治疗

基于刑事案件法律文书的要素提取技术研究

其他学术论文