基于规则的纪传体古代汉语文献姓名识别

来源 :北京师范大学 | 被引量 : 0次 | 上传用户：soso2009520

【摘要】

：

命名实体识别是中文信息处理中的关键技术，而中文姓名识别则是命名实体识别的重要组成部分，因此对于中文姓名识别的研究具有重要意义。然而目前这方面的研究主要集中在现代汉语

【作者】

：

王凌云

【机构】

：

北京师范大学

【出处】

：

北京师范大学

【发表日期】

：

2012年期

【关键词】

：

纪传体古代汉语文献姓名识别模型系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

命名实体识别是中文信息处理中的关键技术，而中文姓名识别则是命名实体识别的重要组成部分，因此对于中文姓名识别的研究具有重要意义。然而目前这方面的研究主要集中在现代汉语文献领域。近年来出现很多数字化的古代汉语文献，为古代汉语文献的信息处理研究提供了良好的条件，开展古代汉语文献的信息处理研究正当其时。　　本论文通过分析古人姓名及纪传体古代汉语文献的本身特点，充分挖掘、利用古代汉语文献中对识别姓名有用的各种信息，辅以从古人姓名库中获得的统计信息，借鉴现代文本中姓名识别的方法，设计了一个可以自动识别古代汉语文献中姓名的模型系统，对纪传体古代汉语文献中的姓名识别作了实验和探索。在使用编程语言(C++)实现姓名自动识别系统后，以晋陈寿的《三国志·蜀书》十五卷(每卷存为一个txt文档，共130KB)为实验文本，对系统的识别效果进行了测试，识别结果为召回率75.4％，准确率91.9％。以此实验呈现了包括命名实体识别在内的自然语言处理技术在古代汉语文献整理研究中的巨大应用前景。

其他文献

二十世纪历史文书研究进展之研究

历史文书,是一种数量庞大,涉及范围广,研究价值含量颇高的文书。但由于其本身具有交叉学科的特殊性,所以,就现阶段而言,文学界对历史文书的研究主要集中于作品的艺术比较和分

学位

历史文书历史文书学研究进展

谈谈小学低年级数学课堂提问技巧的见解

（1）提问的内容要具有趣味性。（2）要面向全体学生提问。（3）要在教学重难点上巧设问题。（4）要给学生充分思考的时间。（5）提问题要抓准时机。（6）提问题要恰当，考虑深难度。

期刊

课堂提问技巧趣味性面向全体

从建设生态文明千年大计看竹资源全产业链科技创新

让竹林成为美丽乡村一道亮丽的风景线,是习近平总书记继2017年11月对国际竹藤组织成立20周年发来贺信之后,对四川省、对全国和对全球竹产业发展的殷切期望,也是对奋战在竹业

期刊

浅谈燃气发电厂汽轮机主汽门裂纹原因及处理

期刊

基于微服务的长期保存系统监控服务体系研究

随着信息技术的快速发展和网络化的普及，数字信息资源的使用越来越普及，数字资源总量呈指数级增长，发展数字资源长期保存系统的目的是在较长时间内保存重要的数字资源并为未来所

学位

长期保存系统监控服务体系微服务运行环境

基于三维模型的网络用户信息浏览行为研究

网络信息浏览行为是人们以半结构化的方式进行信息获取、筛选、吸收的重要途径，也是满足人们学术商务、生活娱乐等需求的重要方式。从认知心理学角度对信息浏览行为进行深入研

学位

浏览行为网络用户三维模型认知维度

电厂锅炉检修注意的问题及维护对策

摘要：就现阶段社会的发展与国民日渐提升的用电需求来看，火力发电厂要想从根本上提升自身的经济效益，朝向可持续发展的目标前进，就要将现阶段的工作的着力点放在提升自身包括锅炉等核心设备的检修上，并在实际的工作中善于积累经验与教训，引进先进的科技技术与理论知识，让锅炉的检修工作更加具有高效性与实效性。　　关键词：电厂锅炉；检修；注意问题；维护措施　　中图分类号：TM621.2 文献标识码：A 文章编号：

期刊

电厂锅炉检修注意问题维护措施

浅谈智能巡检新技术在高压输电线路运行维护中的运用

期刊

国内近十年图书馆管理研究状况分析——基于研究文献关键词的计量分析

图书馆管理是图书馆生存的依托，是图书馆不断发展的保障，是图书馆学研究领域中一个永恒的话题。近年来，随着知识经济的发展和改革开放的推进，图书馆的工作环境日益得到改善，硬件设

学位

图书馆管理文献关键词词频统计共词分析聚类分析可视化

广东省随迁老人异地医保的困境及对策

期刊

基于规则的纪传体古代汉语文献姓名识别

其他学术论文