论文部分内容阅读
近年来,随着多媒体技术和网络技术的发展,e-Learning已成为人们学习的另一种主要方式。e-Learning打破了传统教学在时间和空间上的限制,给学习者提供了一个宽松、自由、开放的学习环境。然而,在e-Learning中,学习者以自主学习为主,长时间处于孤立的学习状态而缺乏情感支持,这已经成为制约e-Learning学习效果的一个关键因素。构建一个具有情感能力的智能学习系统,在学习过程中为学习者提供一定的情感帮助和支持服务,是解决e-Learning中情感缺失的一种有效方法。学习者模型是学习者的个体特征在计算机系统中的一种抽象表示,代表了智能学习系统所理解和认识的学习者。因此,学习者情感建模是实现智能学习系统具有情感能力的关键,具有重要的研究意义。微博是当前最流行的一种社交网络平台,具有简单性、便利性和实时性,受到了青少年学生的广泛青睐。它不仅为学习者提供了一种简单、即时的沟通方式,而且为他们提供了一个自由抒发个人情感的空间,为实现学习者情感建模提供了一条新途径。但是,微博信息噪音较多、内容简短、语法松散,这也给学习者微博的情感分析带来了很多挑战。本文围绕着学习者情感模型的构建,重点研究了基于微博分析的学习者情感建模技术,具体研究内容包括五个方面:(1)融合情感特征的学习者模型;(2)学习者情感型微博的识别;(3)学习者微博的情感语义描述;(4)学习者微博的情感类别判定;(5)学习者情感建模的实现及其在适应性学习系统的应用。在以上研究的基础上,本文取得的研究成果主要体现在以下几个方面:(1)针对现有的学习者模型在特征选择上没有考虑学习者的情感,论文提出了一个融合情感特征的学习者模型,并给出了一个基于微博分析的学习者情感建模框架。该学习者模型包括了学习者五个方面的个体特征,并详细给出了每个特征的形式化描述方法;对于情感状态的形式化描述,基于心理学中的分类表示模型和空间表示模型,提出了一种以基本情感为维度的空间表示方法;通过分析微博在学习者情感建模中的可行性和优越性,提出了一个以微博情感分类为基本思路的学习者情感建模框架。(2)针对学习者微博中包含较多没有表达情感的噪音数据,且难以形成具有代表性的样本数据集,论文提出了一种基于单类分类的情感型微博识别方法,以解决一般的二元分类算法无法有效识别出情感型微博的问题。首先,通过对大量的实例进行分析与总结,提炼出了五条非情感型微博过滤规则,以过滤掉那些易于识别的非情感型微博,缩小情感型微博识别的范围;然后,在现有研究的基础上,定义了26个区分情感型微博和非情感型微博的分类特征,并使用单类学习算法来进一步识别出情感型微博,提高了情感型微博识别的准确性。(3)针对学习者微博的内容简短,使用以关键词作为特征的向量空间模型来描述微博的情感语义会导致严重的数据稀疏问题,论文提出了一种基于情感特征词聚类的微博情感语义描述方法,从特征约简和权重计算两个方面来缓解数据稀疏问题。首先,通过停用词过滤、低频词过滤和基于信息增益的过滤三种策略,从微博情感分类语料库中选择出情感特征词;然后,基于词语的上下文计算词语间的语义相似度,采用层次聚类算法将语义相似的情感特征词聚为一簇,使用词簇作为微博情感语义描述的特征;最后,提出了一种词簇特征的权重计算方法,以组成词语的权重之和为基础,并考虑词语的词簇代表能力和词簇的类别区分能力。(4)针对学习者微博中情感表达具有模糊性,一种分类算法往往不能有效区分所有的情感类别,论文提出了一种基于元学习的微博情感类别判定算法,以充分利用分类算法之间的互补性,从整体上提高学习者微博情感分类的准确性。首先,分别使用朴素贝叶斯、最大熵和支持向量机算法学习得到三个不同的基情感分类器;然后,通过叠加策略和N折交叉验证的方式得到元训练集,并使用元学习算法从中学习得到一个元情感分类器;最后,依次使用基情感分类器和元情感分类器判定学习者微博的情感类别,并将元情感分类器的结果作为最终结果。