论文部分内容阅读
微博舆情事件会带来严重后果,而碎片化和无序化使得难以从海量的微博内容中全面地认知微博舆情事件的全貌。从微博舆情事件内容聚合出其主要内容具有重要实践价值和研究价值。基于关键词抽取技术KEA提出了一种微博舆情事件内容聚合方法。根据对微博内容篇幅、规范性和网络性的分析,增加中心度特征、词性特征和改进词位置特征,并以朴素贝叶斯分类器抽取关键词集作为聚合输出。最后通过现实微博平台上的内容聚合实验证明本研究所提方法相对基线方法在准确率和召回率上的优势。