【摘 要】
:
古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对专家知识有较高要求。该文提出了一种基于深层语言模型(BERT)的古汉语知识表示方法,并在此基础上
【机 构】
:
北京师范大学中文信息处理研究所,北京师范大学汉语文化学院,北京师范大学文学院
【基金项目】
:
国家自然科学基金(62006021),教育部人文社会科学研究青年基金(18YJC751073),国家社会科学基金(18ZDA238)。
论文部分内容阅读
古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对专家知识有较高要求。该文提出了一种基于深层语言模型(BERT)的古汉语知识表示方法,并在此基础上通过条件随机场和卷积神经网络实现了高精度的自动断句模型。在诗、词和古文三种文体上,模型断句F1值分别达到99%、95%和92%以上。在表达较为灵活的词和古文文体上,模型较之传统双向循环神经网络方法的F1值提升幅度达到10%以上。实验数据显示,模型能较好地捕捉诗词表达的节奏感和韵律感,也能充分利用上下文信息,实现语序、语法、语义、语境等信息的
其他文献
汉语方言分区研究是语言学的重要组成部分。鉴于传统基于词汇和语法的人工方言分区方法具有一定的主观性,该文研究了如何有效利用语音本身特征进行方言的自动分区。论文首先
阐述了化学发光法氮氧化物分析仪的工作原理,分析了钼炉转化效率的测定方法并进行了试验。结果表明,在测试中无需知道臭氧浓度,只要加入不过量的臭氧,即可准确测试钼炉的转化效率
为了进一步研究不同真空低温烹饪条件对甜皮鸭肉品质影响,以常温100℃加热条件为对照,将甜皮鸭真空处理后分别在不同温度条件下进行真空低温烹饪,对比甜皮鸭品质差异。研究结果
在粮食储藏过程中,由于现有粮情在线检测技术的缺陷,导致粮情检测点位较少、分布较远,且检测参数仅有粮温,较为单一,不能为粮食储藏提供全面、科学的数据支持。基于感温光纤连续测
创建于1927年的老字号“恒源祥”原来只是上海南京路上一家专门卖毛线的商店。1987年,刘瑞旗被任命为恒源祥绒线公司总经理。当时,同南京路上众多的老字号一样,恒源祥早已没
一、对美术新课程标准的理解 自实施新课程以来,学校组织教师采取多种方式,认真学习,结合课改以前的教学理念所采用的教学方法,比较对照、深刻领会、更新观念。美术学科具有与其他学科不同的特点,对新课程标准的理解有以下几点: 1.美术课程突出体现基础性、普及性和发展性,使美术教育面向全体学生,不同的学生在美术教育上得到不同的发展。美术内容是现实的、有意义的、富有挑战性的,更加有利于学生主动地进行观察、
中国菜有着自身的历史传承,海外中国人想念它,而外国人对于中国菜的接受程度越来越高。川菜是中国八大菜系之一,对于川菜菜名的翻译,目前有一些较好的研究。考察了英国和美国的十
该文探究手术操作术语归一化方法的构建。首先,分析手术操作术语归一化数据集的特点;其次,调研术语归一化的相关方法;最后,结合调研知悉的技术理论方法和数据集特征,建立手术
弯曲菌属于一种重要的人兽共患病原菌,其和肠道系统感染类疾病密切相关。人类感染这种病原菌轻则引起急性胃肠炎等肠胃疾病,严重时也会导致格林巴利综合征(Guillain-Barre syndr
基于农产品冷链物流业的快速发展,从人才需求的角度思考,对广州地区高校农产品冷链物流课程设置情况进行了调查,并对调查结果进行了总结归纳。“,”Based on the rapid developm