基于大数据技术的微博舆情快速自聚类方法研究

来源 :情报杂志 | 被引量 : 0次 | 上传用户:a272437762
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]针对海量的微博舆情信息及微博在网络舆论场中的重要作用,如何快速、准确地获取微博舆情,是提升网络舆情实时监测及分析能力的关键课题之一。目前已能以较高的准确度获取微博舆情,但仍存在舆情获取耗时长问题,为较有效地解决该问题,提出一种基于大数据技术的微博舆情快速自聚类方法。[方法/过程]该方法首先利用大数据技术抓取和处理海量的微博舆情信息,而后根据构建的微博文本相似度速算模型和文本自主聚类模型快速自主聚类微博舆情。文本相似度速算模型通过两文本间同名的特征词数与其特征词数量较小值的比值来度量文本相似度;而文本自主聚类模型以一个主题为聚类起始,自主自适应扩展聚类主题,并将文本相似度大于设定阈值的文本直接聚为一类。[结果/结论]实验结果表明:提出的微博舆情快速自聚类方法能快速、准确地获取微博舆情,且具有较低的舆情误报率和漏报率,可为网络舆情实时监测及分析能力的提升提供一定的方法支持。
其他文献
文章论述了目前铜电解晶闸管整流电源采用三相桥式、三相五柱铁芯双反星形三相零式同相逆并联整流主电路的工作原理及其作用,分析了采用电流闭环实现恒流控制的原理及其性能
从系统原理、结构及计算机软、硬件方面详细介绍了一种由计算机控制的探测式煤位检测系统.
为比较人工低温下山西太原、运城引种雪松与种源地南京雪松的抗寒性差异,人工采集南京及山西运城、太原地区的雪松1年生枝条,设置-5、-10、-15、-20、-25、-30℃低温梯度处理
18世纪瓦特"万能蒸汽机"的发明和广泛使用,开创了人类征服自然的新纪元,世界第一次工业革命悄然来临,工业文明随之在世界范围内轰轰烈烈地兴起,人类社会从此进入了机器化大生
期刊
目前,LonWorks现场总线技术的应用领域越来越广泛.文章介绍了LonWorks技术的系统结构和技术特点,并提出了一种基于LonWorks网络的自动抄表系统的设计思想与实现技术.该系统是
摘 要:“一带一路”倡议让中国和沿线国家实现互联互通,不断促进经贸、文化交流,对我国软实力尤其是高等国际化人才的培养提出更高要求,为推动我国高等教育国际化创造了良好契机,研究生高等人才培养更是承担了顺应时代大势洪流的重要使命,汉语教师志愿者选拔优秀在校研究生奔赴世界各地传播中华文化,成为了中国文化的名片。在“一带一路”大背景下,结合汉语教师志愿者项目,刍议研究生爱国主义精神培育是一项符合时代潮流的
(一)建立完善中小企业信用评级机构。建议由政府主导,以市场经济原则建立和完善中小企业信用评级机构,从事对中小企业信用信息的收集、整理,并按照统一的标准
主要介绍智能化管理应用中监控报警系统的工作原理,并探讨采用以色列探测产品所研制的新型监控报警系统的特点及应用.
翻转课堂2.0教学模式具有民主式教学关系、主动参与式学习文化、分层式教学目标、项目制教学内容、共创式学习策略、生成式知识构建方式等特质。它是针对翻转课堂1.0教学模式