基于多种规则的课程元数据自动抽取

来源 :计算机科学 | 被引量 : 0次 | 上传用户:herewe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则自动抽取的元数据方法。该方法能够按照多优先级规则匹配网页元数据,并按照两步抽取的方法进行精细化处理。针对不同的问题域使用不同规则抽取,不需对程序进行特定修改。实验证明,这种方法能够很好地处理半结构化网页,F测度达到85%以上,具有较好的实用价值。
其他文献
LUC是基于数论的公钥密码体制,相比RSA公钥密码体制,具有能够抵抗共模攻击的优点。但LUC算法因实现难度大,运算时间长而难以用于实际加密。而影响其运算速度的主要因素是密钥长度和模幂算法。本文参考相关文献工作,得到将密钥进行分段计算的公式,而后利用LUC序列的性质将密钥进行分段计算,并在多核系统下实现了LUC并行算法,从而提高了LUC算法的执行效率。
提出了一种基于局部和全局特征的特征提取算法。该算法不仅能保持数据集的局部性,同时也考虑了数据集的全局性,使得降维后的数据既能保持邻近关系,又能从整体上较好地重构和展现。PCA()能较好地展现原数据集,LPP能保持局部邻近关系,算法结合了这两个算法的思想,但由于LPP没有考虑类别信息,故先对LPP进行改进,给出了一种有监督的局部保持投影算法,使得提出的算法能更加有利于分类问题。通过人脸识别实验,验证
羊传染性胸膜肺炎又称羊支原体性肺炎,是由多种支原体引起的一种高度接触性传染病。病羊以高热、咳嗽,有纤维素性胸膜肺炎为特征。典型病理特征为胸腔有大量淡黄色浆液纤维素
文章结合教学工作实践,思考在实施高效课堂立体裁剪课程中,课堂前期准备过程对教学效果有效性的相关影响因素的探究及思考,如何做好课前准备工作,这对实训教学具有重要的指导
相对于传统的P2P文件共享系统,P2P流媒体系统的激励机制更为必要。分析并总结了当前P2P流媒体系统中已提出的比较有代表性的几种激励机制:基于信誉的、基于市场的、基于惩罚的
本项研究通过对日本血吸虫再感染病例及新感染病例多项免疫学指标进行了比较。结果显示反复感染病人对再次感染的体液免疫应答,明显强于初次感染病例,细胞免疫系统对再次感染的
目的 探寻中药治疗肝郁气滞型癫痫患者抑郁的效果。方法 选择80例肝郁气滞型癫痫合并抑郁患者,均来源于本院2020年1月-2020年10月期间收入,按随机数字表法分成两组,对照组和
产后恶露是一种生理现象,指的是女性产后从阴道排出的子宫创面出血、粘液、子宫内膜等物质,这是产后妈妈必须要面对的一个时期,产后恶露期通常会持续4-6周左右。
因特网给我们提供了巨大的信息量,在信息量极其丰富的Web资源中,蕴涵着大量有用的知识信息。信息爆炸而知识匮乏是当今人们所面临的一个很重要的问题。通过搜索引擎来查找信息
提出了一种用于室外移动机器人的道路标志自动统计识别方法。针对我国道路标志图像的基本特征,全面分析转弯道路标志图案后发现:图像的全局特征更易被检测到,而且更不易受到噪声和较小局部失真的影响。提出以全局特征为立足点,采用图像的灰度均值为主要特征量的特征选择与提取方法。在此基础上,分析道路标志图案的分块机理,采用投影和方向特征的处理方法,得到了9个转弯道路标志的特征不变量值。试验结果表明,有噪声的情况下