论文部分内容阅读
随着第四媒体因特网的兴起,很多外国的学者已经开始着手从自己的学科角度出发来开垦这片学术处女地.1993年的ProjectH项目标志着这股研究的浪潮达到了它的顶峰.这一项目汇聚了来自全世界多个学科的上百位学者,他们通过因特网这一媒介来研究自己学术领域内的问题.以语言学为例,在以英语为母语的网民群体中,雷可夫于七十年代所提出的语言风格的性别差异理论被验证为部分正确.虽然国外的学者开展了大量的研究,中国的语言学界到现在也没有这方面的系统研究.正是基于这样的现实,我们决定开展这一以特定的因特网(263 IRC英语频道)为研究对象,旨在验证社会语言学中的语言风格性别差异的研究.该研究采用了定性与定量研究相结合的研究方法.该论文共分五章.在第一章中,我们首先回顾了国外以因特网为基础开展的学术研究,在此基础上对中外学者从语言学角度对因特网的研究进行了比较,进而指出该研究的必要性和新颖性.第二章为文献综述部分.我们主要完成了两项工作,即定义了以因特网为媒介的交流和性别.我们将以因特网为媒介交流定义为在全球合作的网络上发生的、遵循TCP/IP协议和客户端/服务器模型的信息交换.此项工作旨在明确我们的研究范围.我们在全面回顾了过去学者对性别的定义的基础上,重新将性别定义为个人对历史所赋予"猎人"或者"采集者"的社会责任的一种认同感.此项工作的目的在于为我们的性别信息搜集方法提供理论上的依据,即一个人对其性别拥有最终的发言权.在第三章中,我们首先确定了研究的范围为263IRC的英语频道,然后基于雷可夫的语言性别差异理论提出了三个实验假设:1)在这个频道中女性将比男性更多的使用一些表达感情的符号(emoticons,比如:)代表笑脸);2)在这个频道中女性将比男性更多的使用一些系统预先设定的表示动作的命令(acticons,比如用户输入 slap someone系统将显示"某人打了某人一个耳光");3)在这个频道中男性将比女性更多的使用粗俗的语言.第四章对我们的实验进行了详细的论述,这是论文的主体部分.首先是数据的搜集,这其中包括了对未经加工的语料的搜集和性别信息的搜集.我们随机选取了两天(2002/03/11和2002/03/17)、每天四个时间段(9: 00-9:30,12: 30-13:00,16:00-16:30和19:30-20:00)来搜集我们所需的数据.263所提供的聊天软件Sportscar方便了数据的搜集,语料以软件日志文件的形式输出,而性别信息则通过该软件的"私聊"窗口发放的调查问卷来搜集.第二项工作就是对搜集到的数据进行编码.我们设计了一个共有九个变量的编码本,它们是日期、时间、作者号码、作者呢称、性别、表情符号、表动符号、粗话和会话本身.八个时段的谈话记录经过编码处理最终形成了将近两千个案例,共八个样本.这八个样本再经过合并又形成了两个天样本和一个总样本.接下来就是对数据的分析.首先我们利用软件Concordance对语料进行了语言特征的分析,计算了Type/Token比率和词频,通过与LOB和London-Lund语料库的比较,指明了此频道中的语篇具有高度口语化的特点.我们利用Hasan的语类结构潜式理论,分析了此频道中语篇的必要成分和可选择成分,最后得出结论,此频道中的语篇拥有唯一必要成分: turn taking.人们为了保证这一必要成分的出现,使用了大量的"Hi"和"free".这也从一个侧面证明了Hasan的语类结构潜式理论中的"探测"策略的正确.我们利用统计学软件SPSS对十一个样本进行了描述性的统计分析,然后利用统计学软件SAS分析了变量"性别"和"表情符号"、"表动符号"、"粗话"之间的关联性,这通过计算指标KendalTau-b来实现.我们还对发言者的性别确定、包含"表情符号"的案例进行了T检验. 第五章是结论部分.通过统计学分析,我们发现三个实验假设都不能成立,即雷可夫所提出的语言风格的性别差异对于我们所选取的样本人群(以英语为外语的中国网民)在多数情况下并不显著.但三个假设不能成立的原因有所区别.第一个假设不成立是因为所搜集的数据不支持,而第二和第三个假设不成立则是因为包含"表动符号"和"粗话"并且性别确定的例子不足五十个,这样的样本在统计学上不具有分析意义. 与过去的研究相比,该文的与众不同之处在于其是第一个对以英语为外语的中国网民进行的语言学研究.它为后来的研究者提供了可以借鉴的方法论和可以利用的数据库. 由于作者的知识能力有限,再加上其他方面的因素,这一研究还有很多可以改进的地方,比如在性别信息的搜集上可以采取面对面访问的形式,编码应由多个人来进行等等.这样这一研究就将变得更加完善.