基于维基语义聚类的微博舆情主题演化模型研究

来源 :武汉大学 | 被引量 : 4次 | 上传用户:litho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博是舆情分析系统的重要数据来源。微博舆情主题演化能够从微博文本流中抽取出舆情主题,并发现舆情主题随时间的演化趋势,帮助用户快速准确地理解舆情主题的脉络结构、跟踪主题的发展情况,对于政府进行舆情管控以及企业进行商情挖掘都有着十分重要的意义。本文结合微博文本的特点以及微博舆情主题演化的规律,提出一个基于维基语义聚类的微博舆情主题演化模型,从舆情主题的内容和强度两个方面描述微博舆情主题的演化情况。首先,针对所研究的问题,本文对国内外的有关研究现状进行学习和总结,并且对所提模型基于的理论基础和技术基础进行详细的探究,主要是对文本聚类技术、基于维基百科的语义应用和主题演化技术做了深入的探讨,目的是在已有研究的基础上提出本文的研究方法。其次,主题提取是主题演化的前提,本文提出基于维基百科的微博舆情主题提取和表示方法。该方法引入维基百科作为微博文本特征词的语义背景,结合使用维基百科链接结构和主题页面辅助计算微博文本间的语义相似度,改进传统的K-means文本聚类算法,用来对时间片内微博文本集进行聚类处理,得到主题类簇,并提取核心特征词和重要微博文本描述每个类簇所代表的舆情主题。然后,使用基于主题间相似度的主题内容度量方式,来计算相邻时间片主题间的演化关系,绘制主题内容演化图;提出基于微博热度的主题强度度量方式,用来刻画舆情主题强度的演化,绘制主题强度趋势演化图。最后,在微博文本数据集上进行了实证分析,验证本文所提模型的有效性。
其他文献
针对咨询系统缺乏对问句的语义分析,提出在汉语框架语义知识库的基础上,利用语义Web语言,对旅游中有关交通的问句进行语义分析,并利用旅游本体知识库对答案进行抽取和处理。
在日本高知县细木医院、告知大学附属医院进行研修期间探讨日本对护士长绩效考核的情况,对目前日本医院护士长绩效考核现状,如360考核及量化的数字指标的考核方法、以目标为
审美活动从字面上讲就是对美好事物的欣赏。在日常生活中,花无疑是美的直观形态,也是美好事物的一个代表。植物开花之时是其生命美好状态的直接呈现,所以赏花也是对美的欣赏。中国古人很早就懂得这个道理,在对“桃之夭夭,灼灼其华”的吟咏中,表达着对美好生活的向往和对生命绽放的赞美。以至于发展出赏花美学,其主要内容是:欣赏花姿色气味的感官品鉴,欣赏花的寓意内涵的意趣赏玩以及欣赏花的生命意义的审美观照。  姿色生
研制了一种用于低压线路上对线路故障和线损进行显示的故障指示器。所有故障信息通过LoRa上送到智能配变终端中,定时将电量上送到终端中,用于线损分析。该故障指示器分为室内
摈弃传统自然资源价值观的误导,正视自然资源价格形成机制存在的缺陷,借鉴国际成功的经验,重构我国自然资源价格形成机制,要坚持“代际公平、合理补偿”的原则。定价主体以市
利亚德集团是一家以智能显示、城市景观亮化、文旅新业态及VR(虚拟现实)体验为主营业务的跨国集团。  利亚德集团运用4D成像、全息技术、建筑投影等高精尖科技手段,打造了今年2月北戴河春节灯会上的《浪淘沙·北戴河》大型3D魔幻光影秀和7月15日开园的首届光影艺术节,我们还依托公司北京亦庄科研基地,持续发力高精尖产业,辐射和带动京津冀高精尖产业的协同发展。  未来,利亚德集团将继续专注视听科技“智造”,
目的:研究并分析儿童狼疮性肾炎肾转归的影响因素。方法:回顾性分析吉林大学第一医院儿肾科确诊狼疮性肾炎并有完整随访资料的患儿56例,根据治疗结果分为完全缓解和治疗失败
2009年6月10日,李克强副总理在印尼马都拉大桥通车仪式的讲话中强调:“中国在重大基础设施建设方面具有明显的国际竞争优势,中国政府鼓励中国企业不断探索、不断创新的道路前
沟通(Communication)具有一种“乘数”的效果,一个政府机构的政策和措施要发挥到最终的效率,都要靠“传达者”传递信息和“接收者”反馈信息这样一个双向互动的过程来达到相
交通科技发展史注定要在2010年10月28日写下一个完美的注脚,诸多交通科技工作者见证了宏观政策从"十一五"到"十二五"的华丽转身。这一天,在杭州召开的五年一度的全国交通运输科技