基于地理坐标的微博事件检测与分析研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:ydaf4rx3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络和web2.0技术的深入发展和应用,微博改变了传统的社交网络形式,并迅速在社会上流行起来。用户不仅可以在微博平台上及时接触热点社会信息,并且可以通过对微博内容的分享和转发提升相关资讯的传播范围和影响力。微博具有的独特社交网络形式极大地方便了人们进行信息的获取、传播与分享。移动智能设备和无线网络技术的全面发展,让人们可以将现实世界中发生的社会事件“随时随地”的发布到微博平台上。社会性的重大事件往往首先会在微博内容中反映出来,从而引发大量用户的关注并产生巨大的影响力。因此,微博事件检测的意义深远,也是当前微博研究的热点之一。本文的研究目标在于利用数据挖掘算法,从内容繁杂、海量短小的微博数据中检测出有意义的事件信息,帮助用户在有限的时间范围内获取更多有价值的事件资讯,协助相关政府部门进行微博舆情管控和社会行政决策。首先,针对国内具有代表性的微博网站,通过使用微博网络开放接口收集带有地理坐标的微博数据;其次,将这些数据作为训练样本,使用K-means、KNN和决策树三种数据挖掘算法,根据微博数据的发布数、转发数、评论数、用户活跃度和移动强度五个指标来构建微博的地理规律性特征;最后,将日常地区性的微博数据特征与该地区微博特征的地理规律性进行比较,从而检测出该区域是否有事件发生。本文在运用K-means、KNN和决策树数据挖掘算法对微博数据分析的基础之上,提出了基于地理坐标的微博事件检测框架,并且运用R语言对微博事件的发展趋势进行了可视化分析。利用微博事件检测框架检测出的事件信息具有较大的参考价值,尤其是微博用户对该事件的情感和该事件的发展趋势都值得我们分析和思考,为以后应对类似的事件提供借鉴。因此,本文将信息检索的相关理论和技术引入到了微博事件的组织和管理中。为了用户便于检索已检测出的微博事件,本文在开源搜索引擎Lucene的基础之上,同时结合mmseg中文分词技术和jsp动态网页技术,实现了微博事件检索系统,帮助用户了解过往微博事件的内容和发展趋势。最后通过实验分析微博事件检测框架的可行性,并且结合“沙尘暴”事件的具体案例,实现微博事件的精确检索。
其他文献
文章对当今档案中介组织所处的社会发展环境进行综合论述,指出影响档案中介组织发展的社会环境因素,对影响档案中介组织的客观环境进行全面的分析并找出缘由,指出对策,全文分
[目的/意义]探讨已有公共数字文化资源整合项目中不同行为主体扮演的角色及其职能,为未来类似项目的建设提供借鉴与参考.[方法/过程]结合社会学的“角色理论”,(包括角色期待
[目的/意义]以江西省昌北高校图书馆联盟为例,探讨地方高校图书馆如何构建重点学科区域性文献资源保障体系。[方法/过程]分析昌北高校图书馆联盟各高校的重点学科分布与图书
[目的/意义]在知识经济时代,保障公众平等、低成本的知识获取成为学术出版商主要的社会责任之一。理清学术出版商的社会责任是什么,学术出版商应如何推动公众的知识获取,为学
[目的/意义]建立多部门协同管理阅读疗法长效机制模式,探讨阅读疗法对患者身心健康和医患关系改善的效果。[方法/过程]采用读者决策采购模式优化馆藏结构。利用病区助理、hum
[目的/意义]为了解我国标准文献的学术影响力,以为标准文献的利用提供参考,从标准文献的角度出发,分析其被引证特征。[方法/过程]选择中国引文数据库中1994-2013年标准类引文
高校图书馆宣传推广的目的不仅仅是为了提高图书馆的知晓度、美誉度,其最终的目标主要有两点:一是要改变读者对图书馆的态度和看法,影响读者利用图书馆的行为,让他们充分利用
学位
[目的/意义]针对大数据环境下高校图书馆检索系统的信息超载问题,提出一种机器学习方法,为用户提供个性化的偏好检索服务。[方法/过程]通过提取用户检索行为大数据中的用户特
歌唱是一种听觉的艺术,是美的感受。一首好的歌曲只有保证它的完整性,才能呈现出歌唱的艺术之美。《红豆词》这首歌曲,是由词作者、曲作者结合创作而成的,两者缺一不可。在我们拿
学术数据库的普及和利用促使越来越多的研究者倾向于使用它们来进行科学研究,而学者们通过对国内四大数据库的评价可以发现,用户对它们并不满意,需要对其技术和服务进行改进。关