【摘 要】
:
现有的维吾尔文文本情感分类方法以从空格分词中得到的unig ram特征作为文本表示,因而无法挖掘与情感表达相关的深层语言现象.该文从维吾尔文词汇之间的顺序依赖关系入手,总
【机 构】
:
新疆大学信息科学与工程学院,新疆乌鲁木齐830046伊犁师范学院电子与信息工程学院,新疆伊宁835000;新疆大学信息科学与工程学院,新疆乌鲁木齐,830046;
论文部分内容阅读
现有的维吾尔文文本情感分类方法以从空格分词中得到的unig ram特征作为文本表示,因而无法挖掘与情感表达相关的深层语言现象.该文从维吾尔文词汇之间的顺序依赖关系入手,总结若干个词性组合规则,提取能够表达丰富情感信息的Bi-tagged特征,并基于支持向量机(SVM)分类器对维吾尔文情感语料库进行了正负情感分类.实验结果表明,在维吾尔文文本情感分类中:(1)当包含该文提出的各项词性规则时,Bi-tagged特征的性能最优;(2)Bi-tagged特征不仅能够提取情感丰富的信息,而且可以提取否定信息;(3)与常用的unigram、bigram特征以及unigram和bigram的组合特征在该文数据集上的分类效果相比,该文所提取的Bi-tagged与unigram的组合特征分类效果更佳,比该文的Baseline的分类准确率提高了4.225%.该研究成果不但可以进一步提高维吾尔文文本情感分类效率,也可为哈萨克语、柯尔克孜语等亲属语言的情感分类提供借鉴.
其他文献
移动电话是近来消费类电子产品成功的例子.最新的用户数字表明,在英国,现今市场的普及率已达5 2%,而像芬兰等国已高于70%.或许,人们会认为服务供应商将乐于坐享在扩大通信市
精准扶贫已进入攻坚拔寨阶段,文化扶贫是精准扶贫工作中的一项重要内容,本文从项目提出背景、发展困境、发展优势、解决途径四个方面,探讨完善基层图书馆建设,提升文化服务,
2009年以来,在欧元区多国爆发的主权债务危机中,中央政府财政压力与国家主权信用成为被关注的焦点。同时,长期以来欧美等发达国家以及发展中国家的中央政府债务状况也是学者讨论的热点问题。但目前国内关于债务危机的研究文献大部分属于宏观论述,基于数据与模型的实证检验较少。因此,究竟一国财政压力从实际经济的层面是如何形成的?财政压力对主权信用风险的传导又是如何演进的?这是本文力图探讨的主要问题。本文从理解并
数字图书馆是社会文化服务的重要场所,是发展全民阅读建设的中流砥柱,但在资源推广方面面临着很大的问题.本文旨在研究数字图书馆的资源推广,分析数字图书馆在推广方面的重要
5、陌生人的沟通交流 旅行中,人文纪实是绕不过的圈子,但是拍摄一张好的人像照片并不容易,首先要在人群中寻找最有当地特色的对象,沧桑的面孔、精美的服饰、独特的生活习惯都是我们应该关注的重点。我们总希望能拍到当地人生活中真实的一面,但也因为害羞的性格而一次次错失拍摄良机。要拍好人像照片,学会和陌生人沟通交流是重点之一。 一张成功的人文纪实作品按下快门不需要一秒钟,但是按下快门前的沟通可能需要半小时
本文旨在通过对比我国建国以前一百年中美经济发展情况,总结出在各个发展阶段中经济发展情况以及影响经济发展的关键因素,最后总结这段历史得出结论,即被用战争来改变落后的
住房反向抵押贷款保险是一种新型金融产品,是实现以房养老的创新金融工具,也是应对当今人口老龄化挑战的现实选择。本文在文献综述和国际借鉴的基础上,对住房反向抵押贷款保险的
在传统以经济增长为衡量标准的发展观下,环境保护总是处于与经济发展相对立的角度。但是,环境恶化逐渐成为全球各国所面临的异常严峻的、与人类的生存息息相关的现实,对环境的治