【摘 要】
:
随着经济全球化步伐的加快,互联网的蓬勃发展给人们带来了各方面的便利。微博文本蕴含着与人息息相关的海量信息,通过对微博文本进行情感分析可以促进产品的改进、舆情的及时
论文部分内容阅读
随着经济全球化步伐的加快,互联网的蓬勃发展给人们带来了各方面的便利。微博文本蕴含着与人息息相关的海量信息,通过对微博文本进行情感分析可以促进产品的改进、舆情的及时监控、正确决策的执行和实施。本文进行了基于集成分类器的微博情感分类研究。文章对微博情感分为正极性、中性、负极性三类,在词典的构建方面,网络情感词语的提取对微博情感分类效果具有重要影响,网络文本中的用词灵活多变,网络情感词提取困难制约着微博情感分类效果的提高,针对该问题本文提出一种基于Word2vec词向量模型的网络情感词提取方法,此方法以少量的种子网络情感词找到了大量的新的网络情感词。由于对于有限数据集的机器学习任务,通过考虑多个分类器的结果可以减少错误分类的风险,本文针对微博情感分类任务设计了基于SVM、LR、RFC的集成分类器。在随后本文设计的微博情感分类实验中,加入本文所挖掘的网络情感词后使得情感分类效果获得了较大的提升,最后对基于SVM、LR、RF所构建的集成分类器进行了对比分析,实验结果表明将基于SVM、LR、RF所构建的集成分类器引入微博情感分类可以较好地改善情感分类效果。
其他文献
目前,在工业化发展中过度使用化石燃料使得人类面临环境(CO2排放量过多)和能源(不可再生能源缺乏)两大危机。而电化学技术在解决这两大危机方面具有非凡的潜力。一方面通过电化学
伴随着我国高等教育的发展和高校收入渠道的多元化,为了进一步提升高等学府的整体水平,许多高校实施了绩效工资制度。但是由于制度本身的缺陷、运行的多方阻力以及高校人群的
证券错误交易是指在证券市场中因市场参与者行为或交易系统故障所造成的、在价格或其他交易要素上表现出明显错误、与交易主体的交易意图不符,并对证券交易价格形成机制有不
目的:构建鲍曼不动杆菌纤连蛋白结合蛋白Omp33-36、Ton B抗原B细胞表位和T细胞表位,检测相应细胞表位的免疫效果,为制备单克隆抗体和研制鲍曼不动杆菌亚单位疫苗奠定基础。方
公用房是高等学校立身之本和发展之源,在高等学校教学科研蓬勃发展,规模迅速扩张的今天,公用房的保障作用更为显现。高校的办学效益提高,可持续和跨越式发展的实现无不以公用
“社会弱势群体”是指在社会人群构成中难以依靠自己的能力保持个人或家庭最基本的生活,为了维持生计仍需依赖国家和社会给予支持和帮助的社会群体。弱势群体人员在全国范围
目的探讨维持性血液透析(MHD)患者血脂联素(ADPN)改变及与心脑血管事件的关联。方法MHD患者178例,正常对照组30例,分别测定血常规、肝肾功能、电解质、空腹血糖、CRP、PTH及
让计算机具备情感语音交流能力一直是人机交互领域的研究难点和热点。在人类交流的过程中,语音信号既含有丰富的文本信息,也包括了说话人的情感特征。为了获得更富有情感的机器语音,针对机器合成的语音信号进行情感转换研究显得尤为重要。情感语音转换是一种研究将中性音转换为带有某类情感语音的技术,广泛使用于情感识别、医疗、军事等领域。本文主要针对情感语音转换中的特征和转换模型进行研究,主要的研究内容如下:首先,提
互联网技术的迅速发展和日益普及,造成电子文本信息的急速累积,且这些海量原始文本信息甚为冗杂。而文本自动分类作为处理和组织大规模电子文本数据的关键技术,可以在一定程
近年来,模块化多电平变流器(Modular multilevel converter,MMC)因其可拓展性强、谐波特性好、故障穿越能力强等优点,在高压直流输电、大功率电机拖动、电能质量治理等领域受