网络舆情主题标引与意见挖掘研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:xiachl141
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,互联网已成为反映社会舆情的主要载体之一。在这种环境下,论坛、博客、互联网新闻媒体评论区成为成网络舆论的策源地和集散地,是当今中国民意表达和舆论形成的一个不可忽视的平台。从政府管理部门、安全部门的角度,第一时间获取网络舆情,对政策的制定调整,民情民意的了解,并对某些敏感话题进行跟踪并及时做出适当的处理和引导,具有十分重要的意义。但靠人工的监测方式是无法负荷大规模的网络监控的,一套能够利用计算机进行自动化监测的网络舆情分析挖掘系统是十分必要的,进而有效地协助管理人员对舆情进行监控和管理,提高效率和准确性。   本研究在分析国内外网络舆情分析和挖掘领域的发展和现状的基础上,利用自然语言处理技术,从基于内容的文本挖掘的角度出发,对舆情监测系统分析和挖掘过程中的两个关键问题:主题标引和面向舆情的意见挖掘进行研究,并提出相应的解决方案,最后通过相关的实验验证相关算法的有效性。   网络舆情主题标引方面本研究主要提出了一种基于统计、语言特征和主题词影响力的综合加权评估的标引方案。该方案通过对TF—IDF、词性、词位置、词语传播影响力等特征项进行综合加权计算权重,接着在概念层面上利用构建词汇链的方法进行权重调整,最后挑选一定数量的关键词对帖子进行标引。在知名论坛博客和新闻评论上采集20个帖子进行了4个实验相关测验和分析。实验表明,使用该方法进行标引的标准率达到0.45,标全率达到0.75,F1值达到0.557,能够有效对舆情信息进行标引。   网络舆情意见挖掘部分主要提出了一套针对舆情帖子线索的意见挖掘方案。从情感词的收集、意见句的分割、意见句主题抽取、句子级和回帖级情感倾向性分析和帖子线索的粗细粒度意见挖掘等方面进行探索并提出解决方案。通过实验证明,本文提出的方法拥有较强的可行性和较好的挖掘效果,但仍需进一步的研究进行验证、完善和细化。   关键词:网络舆情,主题标引,意见挖掘
其他文献
[目的 /意义]近年来国外高校图书馆游戏服务开展得很成功,游戏服务已经成为宣传图书馆、提升学生信息素养等的重要工具。梳理图书馆游戏服务理论研究和实践情况,对我国高校图
信息贫困是信息社会中继物质贫困的新的贫困现象并成为经济贫困的主要原因。随着信息科技技术的不断发展,信息贫富差距加大,西部地区及边缘地区由于信息化水平低下而逐渐被边缘
[目的 /意义]对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程]总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感
[目的 /意义]针对高校图书馆电子阅览室过去10年的变化,探讨电子阅览室的发展历程及其对师生科研和学习所发挥的作用。[方法 /过程]对2006-2015年发表的高校电子阅览室相关文
[目的/意义]专利技术相关性研究对专利分析、专利管理等意义重大.综述专利技术相关性研究的典型方法,并进行客观分析和评价,以期为进一步研究提供新的思路.[方法/过程]在界定
期刊
人间四月,芳菲盛美!rn“玲珑云髻生花样,飘飘风袖蔷薇香.”于春光浪漫中款款走来,挥手,把湛蓝洒向天空,绿绒植入大地,璀瑰染与花瓣,让一簇簇炫彩将希望赋予万物,用心情和诗意
期刊
政府信息公开是促使政府信息资源优化配置和充分合理利用的重要手段,更是坚持和发展社会民主,建设社会政治文明,促进依法行政,构建和谐社会的必然要求。随着世界各国政府透明化改
学位
目的:医院信息化改革已经成为新时期医药卫生体制改革的重要组成部分,推行和改进以电子病历为核心的医院信息系统已成为医院事实上的战略资本。然而,“IT投资黑洞”“IT使用行为
随着国家知识产权战略的不断推进,专利申请数量以几何倍数增长,专利分析工作的重要作用也日益凸显,专利分析软件理应成为专利分析的必备工具。然而,在实际工作中,专利分析软件的应用不容乐观:专利分析软件的采纳率很低,仅有少数企业机构内部拥有专利分析软件;专利分析软件的使用率低,即使单位内部拥有专利分析软件,但使用的频率低,往往成为一种“摆设”。为何从理论上分析具有良好市场前景的专利软件,在实际应用中却是如