论文部分内容阅读
文本主客观分类是文本情感倾向性分析、观点持有者提取等研究课题的前提和基础。文本主客观分类通常分为基于大规模情感词典的方法和基于机器学习的方法。但因为中文语言的特殊性和复杂性,目前缺乏高可靠性、可用性的中文主客观词典。对此,本文对2-POS模式进行改进,提出2-both-POS模式,并对相应的中文主客观分类方法进行了改进后,添加了自适应阈值。本文的排序表评价实验结果表明按照MI值排序的表更适合作为主观性程度权重表使用。用标记数据对中文文本主客观分类方法进行的测试实验验证了本文方法的改进效果。下一步将考虑与命名实体识别、语法分析等技术结合,同时也应将词性组合扩展至短语方面。