基于文本挖掘的律师推荐方法研究与应用

被引量 : 13次 | 上传用户:xp509
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着我国法制化进程的不断深入,司法案件的审理更加透明。其中,裁判文书的网上公开便是一个很好的例子。人们在解决纠纷时更多的选择了法律武器,而律师又在当中起着重要的作用。互联网技术的发展,使得更多的律师信息出现在互联网上。然而,现有的技术并没有提供一种有效的推荐律师的方法,人们面对互联网上铺面而来的信息,很难迅速而有效的找到自己满意的律师。针对以上问题,本文设计并实现了一种基于文本挖掘的律师推荐方法。该方法以公布在各地方法院网站的裁判文书为数据来源,通过文本挖掘技术获得律师在案件中的表现信息,利用这些信息实现对律师的排名,然后根据用户的浏览历史,并结合裁判文书的特点,向用户推荐律师。为了实现该方法,本文主要的研究内容分为以下几点:首先,为了获取各地区法院公开的裁判文书,本文基于静态模板,研究了多线程爬虫的实现。为了方便用户查询,本文针对大规模的裁判文书文本集实现了全文索引的功能。针对裁判文书中分类信息缺失的问题,研究了文本分类的相关方法,并对KNN分类算法的相关改进进行了研究。然后,基于现有的信息抽取技术,结合裁判文书的结构特征,设计了基于规则匹配的方法从裁判文书中提取信息。裁判文书可以分为民事、刑事和行政三大类,每一类都对应了不同的提取信息。因此,针对不同类型的裁判文书文本,设计了不同的提取规则。最后,根据信息抽取得到的信息,对律师进行排名。由于信息抽取得到的大部分都是文本信息,无法用于计算。因此,要将这些信息转换为可以计算的数值信息。然后,我们要根据提取信息对于律师排名的重要性,给每一个信息赋予不同权重,根据每一个信息的权重综合得到律师的评分。最后,将每个律师的评分进行排序,得到最终的排名结果。利用排名的结果和用户浏览记录,提出了一种基于裁判文书中法律角色关系向用户推荐律师的方法,并通过与传统的推荐算法比较,验证了该方法的准确率与可行性。
其他文献
19世纪末20世纪初之时,掺假食品和药品横行美国市场,肆意威胁着美国人民的身体健康和生命安全。同时,掺假食品和药品的盛行不仅仅给消费者带来了危害和损失,而且也是食品和药
随着凉山电力行业改革的不断深入,凉山经济的快速发展和用电负荷的迅猛增长,凉山电网规模随之不断扩大,新设备、新技术的广泛使用,电力设备的增多,使生产技术部门所承担的任
经济活动中,企业无法避免地暴露在许多风险之下,例如利率风险、外汇风险、价格风险等。随着全球化程度的日趋深入,企业面临的风险种类也五花八门。如何对风险进行管理成为企
何谓法治思维在理论上存有争论。从实体、形式和过程三个视角来看,法治思维具有权利面向、规则面向和程序面向。法治以权利为中心,因而法治思维具有权利面向,权利面向要求注
物流能力是评价企业物流状况和物流水平的一个综合性指标。作为供应链中的重要组成部分的物流是在企业经营中已经起着越来越重要的作用。也是企业的一个新的利润增长点,被称
<正>在2014年度,众多涉贪官员经历了人世间的悲欢离合。作为公职人员,他们曾经是"能人";作为家庭成员,他们是人子、人夫(妇)、人父(母)。在为官之时,他们当中的许多人因忙于
目的:观察黄芪(AS)注射液对心肌梗死后大鼠心室重塑的改善作用及对蛋白激酶C(PKC)的调节,阐明其作用机制。方法:健康Wistar大鼠42只,采用结扎左冠状动脉前降支(LAD)的方法建
20世纪80年代中期以来,为带动本国经济增长,加强区域经济合作,推动与邻国或其他国家之间的区域经济一体化进程,成为当前世界经济领域的一个重要趋势。199]年我国加入亚太经济
为了给规划中的某新区提供基础地质资料,需查明区内断层的准确位置、产状以及覆盖层厚度。由于区内人文干扰和电磁干扰严重,常规电法仪的重复观测误差太大,不能获得准确数据,
病案管理在医院管理中至关重要,对医院管理水平起决定性作用。医院病案管理采用信息技术管理可有效提高工作效率、节约人力资源,相对于传统纸质化管理,能更好地促进医院发展