面向校园论坛的网络书写纹识别研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:wuzhaoan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网已成为广大的高校大学生表达自我、宣泄情感最主要的平台之一。想要了解大学生的内心世界并更好的引导大学生发展,进行大学生的网络行为研究是非常有必要的。本文尝试通过对大学生网络书写纹的识别研究、基于个体作者网络书写纹的话题挖掘研究和基于作者-书写纹-话题的可视化研究来展开对大学生的网络行为研究,并在华中师范大学BBS论坛——博雅论坛上收集了大量帖子作为实验数据进行相关实验。网络书写纹是指用户在网络文字中留下的具有独特写作风格的特征集合,就像人的指纹一样是可以标记作者写作特征的独一无二的标识。因此,利用此技术可以有效的处理网络的匿名性在进行大学生网络行为的研究过程中所造成的不便。本文设计了一种能在大量作者情况下对中文网络书写纹进行识别的集成学习算法模型——基于K折交叉验证的多项式朴素贝叶斯多分类器模型。根据实验验证,在大量作者的同一数据集情况下,相对于已经广泛使用的其他分类识别算法,基于K折交叉验证的多项式朴素贝叶斯多分类器模型具有明显的优势。基于个体作者网络书写纹的话题挖掘研究是对大学生网络行为研究的重要技术,它能挖掘出每个大学生所热衷的话题并得到其所参与的话题概率分布,从而走进他们内心的世界。本文构造了基于作者-书写纹-话题的中文文本话题挖掘模型。根据实验验证,该模型能较有效的挖掘出实验文本的相关话题及关键词,并能进一步挖掘出每个作者的话题概率分布。基于文本的可视化技术是近年来的研究热点。本文设计并构造了基于作者-书写纹-话题的可视化模型,清楚的展示了基于作者-书写纹-话题的中文文本话题挖掘模型中所得到的关于大学生作者、话题与话题关键词的相关结论。极大的提高了作者-话题中文网络文本挖掘模型的可理解性。
其他文献
北京保利二〇一四年秋季拍卖会经过六天共五十四个专场的拍卖,以二十四点九一亿元的总成交额圆满落下帷幕。本次拍卖会成交价超过一亿元的拍品有一件,成交价超过一千万元的拍
进入21世纪以来,中美经济失衡成为全球经济失衡最鲜明的一极,两国经济已经步入“共生时代”,但是合作收益分配机制对中国来说是不利的。而且美国一再指责中国是金融危机爆发的主
学位
目的:探讨盆底MRI在女性压力性尿失禁(SUI)诊疗中的应用价值。方法:前瞻性收集2017年1月至2019年1月首都医科大学附属北京朝阳医院的SUI组和对照组受试者,部分SUI患者行尿道中段
以经济高速成长为背景,日本高中教育在20世纪70年代初实现普及,公立普通高中在均衡发展的同时,呈现同质化倾向,从而背离社会对公立普通高中的多元化要求。1987年,中曾根政府的临时
随着现代科学技术的高速发展,人类社会生活发生了翻天覆地的变化。科学的进步不仅给人们带来了丰富的物质财富,而且在很大程度上也改变了人们的思维方式。但是,与现代科学技术相伴而生的现代科学观却存在种种弊端,主要是其导致了严重的主客两分、价值与事实断裂、人文与科学背离,从而使现代世界观中的世界变得支离破碎,使人们失去对整个世界的总体把握。而作为建设性后现代思想家和主要代表人物之一的大卫·格里芬教授,则通过
休闲旅游文化是引导休闲旅游健康文明发展的精神力量,能够以文化的影响力和感染力约束旅游参与者的行为,提高旅游参与者的精神文明素质和思想道德素质。如何构建符合经济发展
马克思历史唯物主义的异化概念脱胎于马克思早期的劳动异化理论,是马克思分析社会生产力与社会分工的发展过程中,用来阐述劳动者与生产资料相分离,劳动力被异己力量所支配的现象
七月份,在刚刚启用的北京奥运会新闻中心,已经让人嗅到了奥运“新闻战”的硝烟。信息时代,媒体已经成为奥运不可分割的重要组成部分,奥运推动人类进步的社会功能要依靠媒体进
竞争无处不在,新闻传媒之间的竞争在未来的市场氛围中尤为激烈,而近几年各地媒体数量增多,竞争白热化,如何从众多媒体中脱颖而出,恐怕是诸多媒体考虑的问题。增强媒体竞争力