融入公众情感投入的微博话题快速发现及影响力度量方法

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:lxfsb001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动社交网络的快速发展,以微博为代表的短文本信息大量涌现,并以几何方式保持增长,具有非结构化、海量性、实时性、自媒体性等特点。聚集大量涉及公众日常生活有价值的信息,称之为话题。微博文本在移动互联网时代正慢慢承担着短信、博客、即时通讯等功能,不同于传统新闻,不受标题、关键字等固定格式拘束,同时大量短文本信息的同时涌入也为话题信息的抓取、提炼过程带来挑战。微博作为一种移动社交工具,话题信息新颖性、影响力的需求越来越受到公众关注,在恰当的时间、地点发现最有价值的话题也逐渐成为保持用户活跃度的重要手段,而传统话题发现方法不能满足相关话题的发现质量需求。因此,如何解决海量数据环境下的微博话题发现效率以及发现质量问题,从而更好地挖掘分析移动环境下的网络信息,已成为新的研究热点。基于以上问题,本文提出了一种融入公众情感投入的微博话题快速发现及影响力度量方法,主要研究内容包括以下几个方面:第一,针对海量的微博文本,本文提出了一种融入公众情感投入的微博话题快速发现方法。主要由情感词库构建、情感密集期检测、微博话题发现三部分组成。第一部分,基于大规模微博语料库和三大著名情感词集,采用TFDF值以及双字Hash索引表实现具体情感词库的构建;第二部分,基于Sigmoid函数挖掘情感密集期,抽取相应情感文本;第三部分,基于改进的模糊聚类算法,在约简后的文本集中,建立名词性实体表,不断迭代优化目标函数。该方法以情感词为基础,在微博话题发现中融入公众情感,可以有效约简微博文本集,大幅提升信息处理效率,发现高质量话题。第二,本文根据情感词与文本数的依存关系提出了情感密集期的概念。情感密集期挖掘算法综合考虑了微博的传播特性,融入微博转发、评论等影响因素,采用了Sigmoid函数抑制高频次商业微博对话题发现的影响,可以有效挖掘公众情感投入的密集期,提升话题发现质量与效率。第三,随着移动互联网的高速发展,人们越来越离不开社交网络。为解决用户节点在社交网络中的差异化影响问题,本文提出了一种融入公众情感投入的用户节点影响力度量方法。研究新兴网络结构下的微博用户影响力评估方法,避免用户话题兴趣差异造成的影响。主要从用户的真实情感表达出发,以情感词为基础定义了用户的话题情感浓度值,衡量用户对话题的兴趣,提升影响力评估精度。
其他文献
21世纪,市场竞争日益加剧,产品生命周期越来越短,经济全球化的步伐越来越快——企业正面对越来越严峻的生存环境:随着社会经济的进步,商务环境的变化速度大大超过了企业的跟
通过对水平井优化设计的原则、顺序、过程的综述,以及对各阶段设计中应优化的部分、应考虑的多种因素进行了归纳和整理,初步研究和探讨了水平井钻井优化设计技术,并初步分析了优
随着体育课程改革的深入与发展,“初中体育高效课堂构建”的研究日益增多,百花齐放下为初中体育教学活动提供了新的指导方向.要想发挥体育课程的教育重要性,有效培养学生的正
随着时代的发展,传统的教学管理手段已然难以满足现代化教育工作的发展需求,班主任唯有不断增强自身的沟通能力,才能有效提高教学管理的质量水平.本文简要论述了沟通过程中遇
元旦——钟声,这个记忆中的情结,我是在1981年开始留下的,那时带了一批学生在苏、锡、常报社实习,元旦刚巧在苏州,与几个学生一起去寒山寺、北寺塔玩,当天给我的印象是成群结
利用信息资源基础设施指数和劳动力作为投入变量,邮电业务额作为信息资源产出替代变量,运用DEA方法结合Malmquist指数分析我国近几年的信息资源生产效率。结果表明,技术进步
教学内容:rn苏教版数学五年级上册第94-95页的例1及练一练.rn教学目标:rn(1)学生经历用列举的策略解决简单的实际问题的过程,能通过不遗漏、不重复的列举找到符合要求的所有
期刊
小学阶段是学生知识体系构建的关键阶段,在这一过程中,学生除了要进行基础知识的学习,还要进行相关的德育教育,这对于学生三观正确构建,实现学生道德品质提升有着十分重要的
本文针对班级后进生产生的主要原因进行剖析,通过研究关注后进生学习情况、做好后进生家长工作、拓宽后进生教学渠道、优化后进生教学方式等方法,目的在于调动后进生的学习积
图书馆文献实行政府采购进行招投标,给文献采购工作的各个方面带来深刻的影响,结合所在单位开展政府采购图书馆文献的实践,探讨在政府采购条件下图书馆文献采访的组织与管理,