社区论坛冲突研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:rongcs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文深入讨论了互联网发展的现状,互联网舆情的复杂性以及论坛舆情的特点。论坛冲突无处不在,网络匿名性加剧网络冲突,宣泄情感的词的滥用和管理者对过激词语和帖子的屏蔽,使得一般性冲突上升为强烈冲突,强烈冲突上升为过激冲突,更由此引发了言论自由的伦理与法律问题。论坛舆情的特殊性和舆情监控的迫切性决定了论坛舆情系统的重要性,考察社区论坛冲突的形式与规模,提出以论坛冲突信息的分析和利用解决互联网舆情复杂性产生的矛盾。   论坛冲突的分析依托于互联网舆情系统,文章设计了一个包含论坛冲突分析模块的舆情监控与预警系统,给出系统的总体功能、结构和数据处理流程。论坛冲突分析模块在热点话题发现与跟踪模块的基础上,获得参与论坛热点话题讨论的用户ID及其帖子,构建社会关系矩阵得到参与热点话题讨论的用户文本交互关系,先用三维坐标点的x和y坐标值表示这种文本互动关系,再利用文本倾向性分析方法得到用户帖子的冲突倾向的量值,作为三维坐标点的z的坐标值。对矩阵进行行、列和整体运算得到用户的主动冲突倾向量值、被动冲突倾向量值和热点话题的冲突倾向量值。将冲突倾向的量值分为三个级别,过激冲突、强烈冲突和一般性冲突,根据舆情客体的要求进行相应级别的冲突话题的预警及冲突地域属性、时间属性和规模属性的数据分析和上报,以及根据不同虚拟社区的要求进行论坛用户的冲突预警,以达到对言论的监控而非屏蔽的目的。   对社区论坛冲突的分析,本文采用了社会网络分析和文本倾向性分析相结合的方法。对于冲突的指向性和复杂的冲突关系,利用社会网络分析方法构建社会关系矩阵予以解决。对于论坛帖子的冲突倾向,利用文本倾向性分析方法得以完成。文本倾向性分析的三种方法,基于情感词加权方法、基于语义模式分析方法和文本分类方法,过程各不相同又各有特点和适用的文本类型,经过对论坛冲突分析和文本倾向性分析的比对,得出可以采用文本倾向性分析的结论,并选用情感词加权的方法得到论坛冲突倾向量值的具体计算方案。   本文设计的互联网舆情监控与预警系统涉及到文本分类、文本聚类、智能处理、自动关键词提取、主题检测、文本倾向分析、社会网络分析等方面的技术,本文侧重介绍和采用的话题检测与跟踪、社会网络分析、文本倾向分析分别用于冲突话题的确定、参与冲突话题的用户的文本互动关系以及用户的文本冲突倾向计算,都属于数据挖掘技术的范畴。舆情系统功能的完善和升级将依赖于与之相关的文本聚类方法、TDT技术、自然语言技术的进步。  
其他文献
知识链组织嵌入在特定的社会网络中,社会网络的网络结构、关系强度及社会资本对知识链的技术学习有重要影响.网络结构的中心位置以及较多的结构洞有利于知识链成员的技术学习
[目的]梳理学术期刊网络出版的进程,分析纸本期刊的未来,并为期刊发展提供对策.[方法]以“印后上网出版”“优先数字出版”“网络首发出版”三个阶段为研究对象,结合传播学“
专业领域知识应用环境是e-Research环境下科技自主创新的重要支撑,是数字知识基础环境的重要组成部分。探讨专业领域知识环境所处的生态环境,生态环境对专业领域知识环境的作
[目的]了解中国地学科技期刊互联网+新媒体技术的应用现状、效果和存在的问题,为提高我国地学科技期刊的宣传能力和影响力提供参考.[方法]围绕期刊网站、优先数字出版、邮件
讨论RSS的特点及其在个人信息环境设计中的作用,提出基于RSS的个人信息环境设计的目标、原则,结合实际介绍基于RSS的个人信息环境设计的具体方法,最后,分析基于RSS的个人信息
提出一种基于虚词停顿的中文分词消岐的模型.首先利用建立的虚词知识库对文本进行粗分词-划分停顿,然后对句子中停顿间的短语用双向最大匹配再进行分词,提取歧义部分,最后使
针对如何运用形式概念分析(FCA)协助完成领域本体的描述问题,先阐明基于FCA的领域本体描述原理,进而提出基于FCA的领域本体描述模型,最后以脊椎动物领域为例,给出一个基于FCA
伴随计算机网络技术的发展,人类社会信息化程度不断扩大。人们通过互联网可以享受到及时的信息通讯,便捷的信息查询,低廉的服务定制,网络环境不断扩张。通过将信息转换成可传输的
分析电子商务系统内涵及其与ERP系统的关系,阐述B2B模式企业电子商务系统CRM、SCM等业务流程,构建制造企业电子商务系统模型,研究利用扩充UML元模型定义企业建模方法.采用UML
随着我国信息化进程的加快,越来越多的企业建立了自己的门户网站,但是由于缺乏正确的建站理论指导,企业网站普遍存在质量不高的现象。网站评价是随着因特网的发展而发展起来的一