【摘 要】
:
本文主要研究网络文本中的释义模式,以“百度知道”上的释义文本为研究对象,尝试分析释义文本的模式、描述释义文本的面貌。并期望此项研究能应用到工程实践中。本研究基于“百
论文部分内容阅读
本文主要研究网络文本中的释义模式,以“百度知道”上的释义文本为研究对象,尝试分析释义文本的模式、描述释义文本的面貌。并期望此项研究能应用到工程实践中。本研究基于“百度知道”上的问答数据,在采集的100,000个问答网页基础上,进行了人工筛选、标注、分析、抽象等操作,得出了释义的成分、释义的元语言(特征词)、释义框架结构组成的模式。从而描述清楚一种具体的网络文本类型——释义文本——的面貌。 本文共分为五部分。第1章绪论,主要介绍选题的来源及起因,研究目的、价值意义和研究综述。第2章主要对研究对象进行了界定、研究内容、研究方法和步骤进行了论述。第3章详细论述了从语料的选取、预处理到语言模式分析和分析结果说明整个模式研究过程。第一步,采集的语料并按照要求进行预处理,第二步,用一套形式符号体系对这些语料进行标注,第三步,以释义项为中心的思想进行抽象,得出了包含释义成分、释义元语言(特征词)、释义框架及各个成分间关系的模式。第3章还将本次得出的模式与规范定义模式的研究成果进行对比和分析。第4章是实验测试,对所抽象出的模式进行测试并对得出的结果进行分析。第5章总结了本研究的不足之处,并思考了以后工作的方向。 本文通过以释义项为核心的思路,对采样的释义语料的解构、分析和抽象,总结出了包含被释义项在内的31个释义成分、341个释义特征项;与规范的定义模式相比,本文其实更注重更多类型的释义成分以及释义结构,在特征词上本研究得出的数量远超过定义模式中涉及的,只是在本文缺少一些只在书面表达中出现的特征词;最后,我们还通过实验测试了我们得出的释义特征词和结构,证明这些模式是有效的,但准确率有待提高。
其他文献
自二十世纪初英国考古学家斯坦因(MarkAurelstein)在敦煌西北边塞烽燧遗址中得到708枚汉简以来,在甘肃河西敦煌、额济纳旗(现属於内蒙古阿拉善盟)、酒泉、武威等地先後出土了
传统的模糊C均值聚类(FCM)算法具有简单、稳定和高效等特点,但在噪声点较多的情况下容易受噪声影响,使得算法效率降低。文章结合变精度粗糙集模型,提出一种改进的FCM算法,该
由于福建与华东电网互联系统的弱联特性,使故障情况下福建电网存在严重的频率、电压和功角稳定隐患,为防止系统大面积停电或系统崩溃事故,提出了福建与华东电网互联后安全稳定控
近年来,随着国家对职业教育的扶持力度不断加大,职业院校的规模迅速扩张,致使职业院校之间的竞争愈加激烈.在如此激烈的竞争中,各个职业院校要想占有一席之地就必须提高新生
1 背景rnError Vector Magnitude,误差向量幅度,即EVM.它是衡量发信机发射信号调制精度的一个重要指标.EVM的值等于误差向量平均功率与参考信号平均功率之比的平方根(用百分
介绍了在开发数字式电力线载波通信系统过程中涉及的一项关键技术——电力线载波数字接入技术。数字式电力线载波通信系统采用话音压缩、数字编码、数字复接等技术 ,完成话音
游戏在幼儿生活中具有重要地位和作用.幼儿与大自然的亲近,结合丰厚的自然资源的充分利用,我们在幼儿园课程游戏化建设中,大胆融入农村自然资源,激发了幼儿的探究欲.
对于二十世纪的美国南方文学而言,卡森·麦卡勒斯作为一名风格独特的南方女性作家,她具有不容忽视的重要地位。终其短暂的一生,麦卡勒斯主要创作了《心是孤独的猎手》等五部小说
刘三吾(1313年~?),名如孙或昆孙,字三吾,又字坦甫,湖南茶陵腰坡人(今湖南省株洲市茶陵县腰坡镇),性情慷慨,不设城府,晚年自号坦坦翁,元至正丁亥(1347)举人。元末茶陵沦陷后,避兵广西,被礼聘为
课堂教学是学校教学获得的基本组织形式,而课堂教学的有效性需要通过教学语言来获得,而教师的课堂评价语作为课堂语言的重要部分同样起着至关重要的作用.不难发现,小学课堂中