基于微博的新兴热点事件检测研究

被引量 : 0次 | 上传用户:kuwowangzhen111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的不断发展,用户迫切需要一种简便快捷的信息发布和获取方式,微博的出现也就成为了必然的趋势。微博的实时性和便捷性的特点使得其迅速发展,每天都会产生大量有实用价值的文本信息,其中就有对当前生活中热点事件的描述和评论。微博平台常常会将一些热门的话题或事件在首页上罗列出来,推荐给用户,但是这些话题往往只列出最近几天的少量事件,没有实时的给出每天更多的热点事件。这些事件往往不能满足用户对新兴事件的需求,用户如果要找到自己感兴趣的新兴事件,就必须自己寻找相关的微博帖子阅读,在这个信息爆炸的互联网时代,这必然带来很大的不便。当前从微博中准确高效地挖掘出正在发生的热点事件是近年来研究的热点。本文就微博中的新兴热点事件检测做了研究,微博中的新兴热点检测具有实用意义,某些新兴事件,如自然灾害、传染疾病和危害巨大的袭击等事件如果能在早期就检测出来可以有效的帮助政府或者个人及时预防和处理相关事件,从而尽量减少不必要的伤害和损失。论文综合考虑微博用户的粉丝数量和微博本身的转发、评论次数计算每条微博的影响力,从而提出一种基于影响力的微博新兴热点事件检测方法(Influence-Based Emerging Hotspot Event Detection,IEED)。该方法首先对微博数据进行预处理,得到特征向量;随后运用层次聚类将微博文本聚类为事件,得到候选事件集合,聚类过程中运用滑动窗口控制数据流入;最后运用微博影响力以及事件发布微博的数量计算事件的新兴热点评分,并提取出事件中的关键词构成事件摘要,将评分top-k的新兴热点事件推荐给用户。通过运用现实生活中的新浪微博数据作为实验数据集来测试论文提出的算法,实验结果表明,基于影响力的微博新兴热点事件检测方法(IEED)能在早期高效地检测出微博中的新兴热点事件,并准确给出事件摘要,具备一定的实际应用价值。
其他文献
目的 :检测与分析 p16蛋白在食管癌组织中的表达 ,从而探讨其与食管癌发生、发展及预后的关系。方法 :应用免疫组织化学检测 p16蛋白在食管癌组织中的表达 ,应用 χ2检验、乘
瑶族干栏式建筑由围篱式叉叉房发展而来,能很好地适应南方山地多雨潮湿气候。干栏式建筑底部采用立柱圈梁结构支撑,楼的整体部分因抬起而不与地面直接接触,不仅有效地解决了
<正> 新会计准则《企业会计准则第34号——每股收益》首次对稀释每股收益的计算和列报进行了专门要求。新准则第七条规定,企业存在稀释性潜在普通股的,应当计算稀释每股收益
现阶段,"微课"的合理化建设将对高职教学改革起到一定的推动作用。但有人认为"微课"就是把现有四、五十分钟的教学内容分割成几个小于十分钟的教学内容,这样的理解未免简单、
中国农村资金互助自2004年产生以来,取得了稳步发展,但同时在法律的规范、成立的门槛、资金来源和风险控制方面仍存在一定不足。通过对美国农村金融体系优点的研究,并结合中
<正>在浩如烟海的中医档案古籍中,尤其著名的是《黄帝内经》,只有真正能领悟其精髓的人才会感到全书都弥漫着漫漫长河中的养生智慧,浸染着悠远的兰香芷白,而许多现代医学技术
采用气相色谱法和国家标准比色法分别测定白酒中的甲醇、杂醇油及其它高级醇类的的含量,通过两种测定结果比较,气相色谱法测定结果的绝对差值小于比色法,用气相色谱法还同时
通过对美国哈希专用仪器测定COD方法中试剂的改进 ,不仅替代了昂贵的进口试剂 ,而且样品消解时间由原来 2h缩短至 30min ,分析结果准确可靠。该方法具有操作简便 ,安全性好 ,
突发灾害和自然灾害所造成的损失和破环是十分严重的,预防和处理突发灾害显得尤为重要,所以卫星通信的需求和要求日益增多和提高。应急卫星通信系统不仅要求机动性强,通信无
<正> 一《论语》真相——孔子的中心思想我在二十年代匆卒写出《孔子哲学之真面目》一书,虽已有些涉及"礼"的重要性与汉儒的墨冠孔戴、宋儒的佛冠孔戴,但仍不免人云亦云。经