基于语料库的鲁迅杂文语言风格研究

来源 :南京师范大学 | 被引量 : 9次 | 上传用户:parisjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鲁迅的杂文是我国白话文时期乃至当代文学创作的集大成者,具有重要的研究价值,但前人对鲁迅杂文的研究主要集中在其艺术性、思想性、战斗性等方面。从语言风格角度对其进行的研究也不少,不过主观性成分较重,借助语料库以统计的方法进行客观分析的则很少。因此,本文在前人研究的基础上着重对鲁迅杂文进行了统计与分析,先定量统计再定性分析,以客观地展现其语言风格。本文的主要研究思路如下:首先,建立3个语料库,分别是容量为820059个字符的鲁迅杂文语料库、容量为139914个字符的鲁迅小说语料库、容量为61074个字符鲁迅同时期作家的杂文语料库。其中后两个语料库为参照语料库。其次,在词汇层面和标点层面以鲁迅小说为参照语料库,对鲁迅杂文和鲁迅小说的词长、句长、单音节词、双音节词等17个语言特征的出现比例进行统计,发现共有11个语言特征具有显著的区别作用,并且以这11个语言特征为基础,主要对单音节词、代词、名词、词汇多样性及部分标点符号进行了具体分析。得出鲁迅杂文相较于鲁迅小说文言性强、“底”的出现复杂、词汇丰富度低的特性。再次,在构词层面,以其他作家杂文语料库为参照语料库,对这两个语料库中未能被准确划分的词语进行了统计分析。分析发现鲁迅杂文中有着丰富的仿词、文言词、异序词、词缀等,构成了其独特的语言风格。其中尤以仿词较为突出,鲁迅杂文中的仿词共有82处,而其他作家杂文中只有10处。词缀方面,“支”和“气”只有鲁迅杂文中有,而鲁迅杂文中的“们”运用得更自成一派。最后,利用n-gram分析了鲁迅杂文中不同长度词串的出现规律,分析得出词长越短使用越灵活,如二词长、三词长的词串;而长度较长的词串则具有一定的限制性,将词串直接限制在某一篇章中。本研究以鲁迅杂文为研究对象,主要从词汇层面和构词层面对鲁迅杂文进行了对比分析,对分析中国现代文学作品尤其是白话杂文有一定意义,也可应用于其它类型文本的处理分析中。
其他文献
张仲景在我国传统医学史上享有极高的地位,被推崇为"医圣",其著作《伤寒杂病论》更是被历代医家推崇为方剂鼻祖,集医理组方辨证于一体,其组方用药精简且疗效极佳。本文从仲景
建立基于人工神经网络的石油专用设备投资评价模型,并利用大庆油田的历史数据对模型进行训练和模拟.以向石油企业提供科学合理的石油采油设备投资决策方法。
新课标从“知识和能力”、“过程和方法”、“情感态度和价值观”三个维度出发调整课程内容和目标,变革学习方式和评价方式,构建具有时代性、基础性和选择性的高中语文课程的
目的关于老年慢性支气管炎急性发作期应用药物预后的临床价值研究。方法选取80例来我院进行呼吸系统疾病诊疗的老年患者进行研究,待患者确诊为慢性支气管炎(急性发作期)后,对
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
为进一步探讨老年尿毒症维持性血液透析(CHD)的特点和治疗中出现的难题,指导今后的血液透析(HD)工作,现将我院近10年CHD260例中52例老年尿毒症患者2063次HD的临床资料进行回顾性分析,报告如下。资料和方法
传统成绩管理系统存在数据易窜改的问题。本文根据区块链不可窜改的原理设计并实现课程成绩查询系统。系统基于以太坊技术开发,采用Node. js作为服务器后端运行环境,前端使用