大数据环境下教育资源语义分析的研究与应用

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:guoyinglonggyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息通信技术的不断发展,互联网将系统行业在内的各行各业结合起来,使教育意识形态的发展也呈现新的特征。在大数据时代,各种教学信息大量涌现,而传统的教育信息调查、评价体系,往往需要大量的人工评阅,难以保证调查的效率与客观。如何有效提取网络信息特征解决网络教学的自适应性,准确把握教学目标需求成为教育技术专业急迫解决的问题。本课题源自科技部项目《内容银行评估系统》,基于大数据评价系统,通过构建文本分析模块,对关键词提取算法与情感趋向评价做出重点研究,并应用于具体的教育文本资源的分析。力图改变传统调查手段及评价方式,解决教育改革中存在的问题,训练、搜索教育领域中的诉求。基于大数据评价系统,文本评价的首要工作就是对网络数据的获取,为了更加广泛、全面的获得互联网和移动互联网的教育相关信息,采用网络爬虫技术抓取互联网数据,突破各种网络站点的限制,获取Wed端数据与移动端信息数据。建立文本分析功能模块,为了分析更加广泛、全面的网络教育资源数据,本文采用关键词提取技术与文本倾向分析技术,设计实现文本分析功能的子模块。并实现对于非结构化数据的量化及标准化,最终完成文本数据的相关挖掘、评价工作。基于大数据环境,非结构化的文本数据的有效整合与分类存在着一定程度的障碍,本文运用聚类算法,实现对非结构化数据的有效分类。通过文本分析,利用关键词抽取技术抽取关键词,可以实现教育文本资源的特征提取,但是碎片化的关键词会对文本的原有含义产生歧义的分析结果,误导评价者做出不正确的评判,而本文基于关联规则算法,从最频繁集及词语相关性两个维度来对文本语义进行分析,可以有效改善上述问题,基于各分词之间的关联规则,对网络教育资源文本的评价有一个更为清晰的认识。最后,针对现有情感趋向评价算法低效的现状,本文提出通过随机森林算法训练出更加有效,更有针对性的基于教育专业领域的情感字典训练集分类器,通过优化随机森林的节点数和森林个数来优化关键提升模型的有效性。
其他文献
角膜新生淋巴管构成了角膜免疫反应的传入弧,它与角膜新生血管的协同作用是破坏角膜免疫赦免机制的关键因素。近年来,随着淋巴内皮细胞特异性标志物的相继发现,有关角膜淋巴
本文叙述了国内外砌块成型机研制生产模具的过程.
目的探讨应用蒙特利尔认知评估量表(Mo CA)和简易精神状态量表(MMSE)对椎动脉型颈椎病(CSA)患者的认知能力评定后进行S100β、神经元特异性烯醇酶(NSE)、超敏C反应蛋白(hs-CR
为适应消费发展新趋势,引导首都消费结构转型升级,促进商品消费及服务消费共同增长,10月30日至11月29日,北京首次启动为期一个月的“2017北京时尚消费月”活动。该活动由北京市商
为解决低剂量CT(Low-Dose Computed Tomography,LDCT)图像中的噪声/伪影问题,提出一种基于非下采样Shearlet变换(Non-Sample Shearlet Transformation,NSST)的卷积神经网络(C
残疾是社会发展的一种必然现象,残疾人由于生理方面的缺陷,往往更容易在心理上产生一些困惑和障碍,影响其社会心态的形成。而中国特色社会主义进入新时代,社会主要矛盾已经转
为了筛选甘薯颗粒全粉的评价指标,分别测定了56种不同品种甘薯颗粒全粉的感官指标(L*、a*、b*和中位径D50)、理化指标(游离淀粉、水分、得率、粗蛋白、粗脂肪、粗纤维、胡萝卜素和
“一带一路”峰会丰硕的成果举世瞩目,它也从一国倡议变成了多国的共识,特别是“一带一路”沿线国家丰富的农业资源为中国农业“走出去”带来极大的市场,为农业“走出去”创
随着全球化的不断深入和现代科技的快速发展,人类彼此间的互动交流日益频繁。学会合作、学会共处是当今社会的时代要求。培养合作意识增强合作技能逐渐成为教育发展的重要任
《INCOTERMS》即规范商贸术语,是保证贸易正常进行的重要约束力量,更是全球范围内多边机制的重要结果。在国际商贸往来逐渐扩大的趋势下,国际商贸术语的变化和发展也显现出多