【摘 要】
:
通过对文本情感分类的研究,考虑微博文本信息的篇幅短小、情感符号丰富及大量网络词汇的特点,提出一种适用于中文微博情感分类的基于Map/Reduce的分布式朴素贝叶斯算法。算法通
【基金项目】
:
上海市自然科学基金项目(09ZR1409500)
论文部分内容阅读
通过对文本情感分类的研究,考虑微博文本信息的篇幅短小、情感符号丰富及大量网络词汇的特点,提出一种适用于中文微博情感分类的基于Map/Reduce的分布式朴素贝叶斯算法。算法通过构建适用于微博文本的情感词典来完成情感特征属性的提取,以期达到较为理想的分类效果。实验结果表明,这种方法能够很好地适用于微博情感分类,达到较理想的分类效果,满足针对海量的微博文本数据处理的可行性与高效性的需求。
其他文献
在气体钻井过程中,钻柱截面的变化会使高速气流产生涡旋,诱发钻柱振动,影响钻井安全。通过对气体环空流速与压力的计算,模拟得到气体对钻具的冲击作用规律以及气体排量对振动
在建设项目施工阶段,发包人依据与承包人签订的工程承包合同进行合同实施、监督管理工作,以期实现“工期短、质量高、投资少”的合同目标。为此,文章着重阐述施工期发包人合同管
传统杂波计算中将地、海面进行等距离-等多普勒划分,网格面积计算复杂,缺乏上视公式,计算结果不够精确。使用自适应网格划分方法进行地海面网格划分;根据坐标转换得出面元对
一、重要意义大数据信息化时代已成为社会各界各行的主流形式,地质环境工作亦是如此,尤其是地质灾害综合治理三年行动计划的推进和实施,取得了很多成果。这些成果和成效记录
钢筋混凝土箱涵,由于设计、施工方面对一些问题未给与足够的重视,部分在建和已建结构出现顶板裂缝、横断面环向裂缝、节点裂缝等问题。主要从设计、施工方面分析此类裂缝出现的
东北黑松是国家树种种植中较为名贵的经济树品。它不仅有一定的绿化作用,而且能够有效的吸附空气中的二氧化硫和粉尘等污染物,是东北地区进行园林生态绿化的优良树种。通过对黑
内蒙古贺兰山国家级自然保护区是内蒙古西部较大的天然次生林区之一,是我国北温带干旱风沙地区典型的内地森林生态系统,是内蒙古平原和腾格里沙漠的分界线。保护区野生动物资
针对当前电力企业职工教育培训的主要问题,提出了若干加强电力企业职工教育培训的对策与建议。
Aiming at the main problems of employee education and training in elect
根据某雷达信号处理硬件系统的主要处理方式,分析了机载PD雷达信号处理的算法及其主要过程,提出了软件构造模型及其接口方式。文中介绍了基于上述分析编程的机载PD雷达信号处
设计了一种分布式扩展卡尔曼滤波器,对非线性目标状态进行估计.在设计过程中,对滤波误差上界进行优化,获得了最优滤波增益.此外,在通信过程中,考虑恶意攻击信号的同时引入了