【摘 要】
:
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科"人文性"与"计算性"特质具有重要意义.本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析.首先在无标注集环境下提出一种基于"冷启动"的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则.研究发现,将现代鉴赏融
【机 构】
:
南京大学信息管理学院,江苏南京210023
【基金项目】
:
国家自然科学基金面上项目"关联数据驱动下我国非遗文本的语义解析与人文计算研究"(编号:72074108);中央高校基本科研业务费项目"面向人文计算的方志文本的语义分析和知识图谱研究"(编号:010814370113)的研究成果之一~~;
论文部分内容阅读
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科"人文性"与"计算性"特质具有重要意义.本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析.首先在无标注集环境下提出一种基于"冷启动"的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则.研究发现,将现代鉴赏融入古诗原文显著优化了情感知识的广度与深度,领域术语能够被有效标引.训练的BERT-BiLSTM-CRFs深度学习模型的效果明显优于CRFs机器学习,最佳F1与F1distinct可分别达到95.63%和85.43%;同时汉字特征的引入也有效提升了传统CRFs效果,以领域特征和基于"竖心旁""心字底"部首约束特征为最优.相较于机器学习抽取出的长篇幅新术语,深度学习能够拓展出更多寄托情感知识的新意象词.源于诗文与鉴赏的情感术语为文学信息资源的情感分析与知识服务提供了参考(人文性),基于汉字语言特征的抽取方案为中文领域自然语言处理技术的深化提供了启迪(计算性).图11.表6.参考文献30.
其他文献
党中央、国务院高度重视数字经济发展,作出了一系列重大决策部署。习近平总书记强调,数字经济是全球未来的发展方向,要大力发展数字经济,加快推进数字产业化、产业数字化,推动数字经济和实体经济深度融合。这为我们工作指明了方向、提供了根本遵循。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(以下简称“十四五”规划纲要)提出,“迎接数字时代,激活数据要素潜能,推进网络强国建设”,
随着《“健康中国2030”规划纲要》、 《关于促进”互联网+医疗健康”发展的指导意见》的出台,互联网+医疗业务像雨后春笋蓬勃发展,但信息安全威胁随之增加。在互联网+医疗健康大背景下,醫院网络安全保障体系应该如何规划和建设?如何从以往的静态防御向监测预警、主动响应的深度防御转变?医院信息安全管理的范围包括哪些? 一、 重新定义医院网络边界 随着互联网+医疗的不断演变,医院网络形态不再是封闭隔离,
在面临挑战时,最有韧性的企业正是那些大胆采用技术来革新业务流程的企业。 在一年一度的全球蓝宝石大会上,SAP宣布了一项宏大的愿景——创建一个全新的商业社区,以改善业务成果、应对经济和地缘政治的不断变化,并加大对可持续发展的贡献。SAP同时迈出了实现该愿景的第一步,推出了汇集采购、物流和资产智能网络的SAP Business Network(商业网络),这个互联社区拥有550多万个成员组织。SAP
科技情报事业的发展是同情报学理论研究和学科建设紧密相关的,两者互相促进,密不可分.本文从情报学理论演化的视角出发,考察在中国科技情报事业的初创期、恢复发展期、改革探索期、深化发展期、转型创新期等不同历史发展阶段中情报学理论和学科建设的作用及影响.针对当前我国国家战略和新一代信息基础环境下情报学学科建设和事业发展面对的变革挑战,从情报的"耳目、尖兵、参谋"作用、情报学与数据科学双融等方面探讨情报学理论研究如何更好地指导中国科技情报事业发展和科技情报工作实践,包括:科技情报工作要坚持为决策部门提供广快精准的情
为提高资源描述的规范化及标准化,提升资源之间的互操作能力,各类型词表不断被创建及使用,词表重用已成为资源描述中的关键问题.本文从资源描述的基本结构出发,基于数据模型和资源标注两个阶段对词表层、模式层及数据层进行详细分析;探讨词表层、概念层两种重用类型,认为当前用户更关注于词表层重用,概念层重用将随着词表生态环境的完善得到进一步发展;以数据模型中的类与属性为划分对象,以RDF三元组形式入手对词表重用实现方式进行深入研究,有助于明确各种方式之间的差异性及适用环境,能够有效地指导用户运用已有词表对数据集的类、属
超声医学是医学影像学的主要分支学科之一,由于超声技术在临床日益普及,需要大量的超声应用人才。我国目前超声应用人才的储备和培养严重不足,无法满足临床的大量需求。与此同时,由于实时教学病例资源的不确定性,往往会影响超声临床教学的顺利开展。建立系统全面的超声医学科教学病例库,有利于理论联系实际的形象化,克服传统教学的死板模式,极大地提高了教学工作效率,充分利用教学资源,提高教学质量,为科研工作提供并建立完善的数据库模式。文章介绍了超声医学科教学病例库的内容,利用医院网络信息化平台的病例收集与管理办法,及其在授课
摘 要 民办高校定位于培养服务地方经济的应用技术型人才。转型发展要求民办教育转变思路、融合创新,迎合多样化需求,形成特色化办学。探讨民办高校构建优势学科群的重要性及优势学科群的创制路径,指出要想在同质化的竞争中赢得先机,建设优势学科群是高校实现可持续发展的必然趋势。 关键词 民办高校;优势学科群;学科梯队 1 引言 “十三五”国家教育事业发展规划将高等教育特色发展和分类管理作为应用型高校发展
摘 要 离心泵是过程流体机械课程讲授的最主要装置之一,其中,汽蚀余量的概念及表示方法是比较难掌握的知识点,学生很容易混淆教材中的三个汽蚀余量计算公式。推导有效汽蚀余量和必需汽蚀余量的定义式和计算式,阐明五个公式的物理意义,并分析不发生汽蚀的条件,梳理和归纳知识点,方便学生准确理解和应用。 关键词 过程流体机械;离心泵;有效汽蚀余量;必需汽蚀余量 1 前言 过程流体機械是过程装备与控制工程专业
一、5G技术的发展及其在医疗行业的应用 近年来,随着移动通信技术的发展,5G技术,即第五代无线传输技术已进入落地阶段,在医疗、工業、安防等多个行业试点使用。相比之前已广泛应用的2G、3G和4G移动网络,5G技术具有高速率、低时延、可靠性、高带宽和广连接等独特的特性,可极大提高数据的传输速率,覆盖海量用户,真正实现万物互联。 在健康医疗领域,5G技术除了提供更快、更可靠的互联网连接,还将推动医疗
随着两化融合的不断深入,工业互联网已经成为推动制造业数字化转型的重要载体。浙江省杭州市临平区作为我国数字经济的桥头堡之一,近年来加大政策力度发展工业互联网,积极布局“未来工厂”,通过制造业数字化转型带动区域经济实现高质量发展。 7月29日,由工业和信息化部、国务院国有资产监督管理委员会、浙江省人民政府主办的第三届中国工业互联网大赛在北京正式拉开帷幕,杭州临平区为本届赛事的半决赛、总决赛的举办地。