中文微博情感词提取:N-Gram为特征的分类方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:herirong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法,如点互信息等,对中文微博数据中的新情感词发现是无效的。为此,设计一组基于上下文词汇的分类特征,即N-Gram特征,以刻画情感词的用词环境和用词模式,并以已知情感词为训练数据训练分类器,对候选情感词进行分类。实验结果表明,该方法较传统基于共现的方法要好。实验还发现,与英语不同的
其他文献
对湿法提铟过程中铁的行为(包括主要来源以及开路方式)进行了分析,进一步说明了铁对湿法提铟过程的危害,并且系统地讨论了湿法提铟过程中铁的控制方法,对湿法提铟的生产具有
配电线路的故障对配电线路的正常运行有着较大的危害,本文将分析、概括10KV配电线路故障以及其产生的原因,并根据相应的故障及经验归纳总结10KV配电线路故障的防范措施。
目的探讨高压氧治疗脑梗死的时间窗选择及评估治疗的有效性与安全性。方法将90例首次发病的急性前循环脑梗死患者随机分为A、B、C组,每组30例。3组患者均给予相同的基础药物
文章阐述了当前国内室内装饰设计的现状并对存在的问题提出了改进创新的措施,旨在提高室内装饰设计质量。
研制一种用于不锈钢表面锈蚀常温快速清洗的除锈剂,基础配方由盐酸和硝酸以18%∶18%的质量比组成,加入一定量的磷酸、柠檬酸、焦硝酸钠等,可以提高除锈效率和不锈钢的表面光
新中国成立60年以来,与东南亚关系经历了复杂的和巨大的变化。以1990年代初冷战结束为界,中国与东南亚的关系大致上可以分为冷战时期和冷战后时期,冷战时期可分为五个阶段,冷
在今后的区域竞争中,辽宁老工业基地应主要依靠自主创新推动经济增长。因此,辽宁老工业基地自主创新必须和提高区域竞争力相结合,和主导产业形成核心竞争力相结合,和强化企业
为探究连翘酯苷A抑制LPS协同诱导大鼠类风湿性关节炎机制,将40只SD大鼠[体重(120±2)g],随机分成4组,每组10只,分别记为对照组、类风湿性关节炎组、LPS刺激类风湿性关节炎组
移动通信是20世纪经济、能源、交通运输与通信技术高速发展相结合的产物。在20世纪的最后十年,移动通信特别是数字移动通信发展之快和应用之广,大大超出了人们的预料和专家的预
目的:探讨慢性肾脏病(CKD)1~4期患者血清1,25(OH)2D水平与蛋白尿、尿炎症细胞因子的关系。方法:对我科115例CKD1~4期患者及20例健康对照者进行血清1,25(OH)2D、血CRP,尿TGF-β1