融合学习者背景信息的话题挖掘研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:xue852456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,信息技术正在迅猛发展,互联网正改变着世界,大规模在线学习成为教育界的热点话题,各类学习平台已成为学习者们留下数据,发表文字来表达自己内心想法的重要平台。教育基础理论认为,最好的教育就是促进教育三要素(教育者,学习者,教育影响)的相互配合,相互了解,本文立足于教育理论,以华中师范大学云平台学习者在课后讨论区留下的文本数据为基础,结合学习者个体的背景信息数据,尝试对在线学习平台中学习者发表的文本数据进行研究,他们遇到的困境是什么?他们的兴趣话题是什么?以此建立教育者,教育管理者与学习者的了解与联系,便于快捷有效地对教育进行调整,使得教育能够达到最好的状态。在大量教育数据产生后,数据分析也应运而生,其中文本分析是研究学习者兴趣话题的重要手段。在文本分析中,较为困难的基础工作是对中文文本的预处理,一般采用TF-IDF算法进行文本特征化或进行中文文本分词。传统的文本分析方法是先进行人工标注文本数据,然后结合机器学习的基础方法进行研究。如朴素贝叶斯分类,K近邻分类法等。主要目的均是探究学习者的讨论话题,讨论类别。该类方法一般用于文本话题的二元识别,如识别文本数据中的话题是探索型还是非探索型。概率话题模型是基于贝叶斯概率理论针对文本数据的一种典型的分层模型,在文本话题以及单词之间建立联系。潜在的狄利克雷语义模型是一类典型的话题模型,目的在于自动化挖掘出学习者的兴趣话题。该模型比起传统的分类有明显的优势,在运行方式上更加灵活,而且适用于目前教育数据爆炸的时代。本文提出一种拓展参数的狄利克雷模型,结合学习者的背景信息数据进行话题挖掘研究。该模型能够自动化挖掘出学习者发布文本中的讨论话题,并能结合学习者背景信息确定不同性别以及不同专业的学习者所感兴趣的话题。在话题挖掘的实验结果中,可以明显看到不同专业性别的学习者在不同话题中所体现出的兴趣差异,并能够了解到学习者的困惑所在。如数学专业的学习者偏向于心理学等话题内容的讨论,在关于胎儿胎教的话题讨论中,性别方面几乎全部是女性群体。结合学习者背景信息数据的话题挖掘,可以探究到不同类别学习者的兴趣所在,看到学习者群体的兴趣差异。数据可视化技术是近年来大数据研究的热点。本文列举了常用的数据可视化技术以及文本可视化技术,并基于本文实验进行结果可视化的展示,较为清晰地展示了不同类别学习者讨论的热点,较大幅度提高了文本数据的可读性与可理解性。在未来,可以展望更多的将学习者个体数据以及所发表的文本数据的结合研究,融入时间参数将是一个重要的研究点。对于学习者的数据挖掘研究将是信息技术与教育融合的关键。
其他文献
期刊
With the rapid development of the communication technology and themicro-electronics technology, the network and personal computers have been essentialtools in o
期刊
随着现阶段医院规模的逐步扩大,其档案管理工作呈复杂化趋势发展.本文以医院档案管理信息化为主要研究对象,由医院档案管理现状展开研究,从建立档案数据系统、加强行业内部交
机械发展是人类社会进步的标志,随着科技的快速发展,机械设备设计的理念也得到不断的创新和发展,智能化机械设计理念也受到人们越来越多的关注.如今机械化设计理论应用到计算
毛泽东主席的问候1945年8月28日,烟雾迷蒙的重庆传来一个振奋人心的消息:中共主席毛泽东今日抵渝同国民党谈判。这消息像闪电般冲破阴霾,给国民党统治下的黑暗山城带来了光明
介绍了对环境监测实验室内化学废弃液进行减量化、无害化处置方法和对废弃液的管理方法进行了初步研究.
针对煤矿城市鹤岗市大气中污染物状况,主要对颗粒物来源进行调查分析,提出改善地气状况的建议.
吸烟是严重的公共卫生问题,长期吸烟可导致呼吸系统疾病和多种脏器病变[1]。香烟的成分十分复杂,估计有4 700多种化合物,其中3 000种已得到确认,而且许多物质已证明具有致癌
期刊