论文部分内容阅读
面对海量知识资源,如何挖掘知识点与学习资源内部的关联关系,解决学习资源组织结构较差、聚合性不足的问题是当前的一个研究热点。本研究从知识与资源间的关联关系出发,通过运用语义分析、机器学习等技术探究知识资源关系,旨在实现知识点与学习资源的有效关联,促进知识与资源的深度聚合。首先基于语义分析技术,提出一种知识资源自动关联的混合策略,综合运用了 LSI和LDA等文本主题模型从丰富的知识实体中挖掘出知识主题,并且将知识点和学习资源转化为主题向量,通过向量之间的语义关联关系,计算学习资源和知识间向量的相似度,实现学习资源和知识点的初步关联。同时,因为知识点和学习资源关联的特殊性,以及知识点的描述信息有限性,单纯利用语义方式计算关联权重,在计算结果上会存在偏差,尤其是对于部分隐性知识以及多义词情况,实现知识资源有效关联就变得更为困难。因此本研究重点提出基于众智的关联权重计算方法,利用学习者的语义理解能力和先验知识,标注学习资源和知识点关联权重,将众人标注结果与机器学习方法相结合完成学习资源与知识点关联标注。本研究将知识资源关联标注工作以任务形式分配给用户进行标注,在进行任务分配时候综合考虑了用户背景信息和任务信息,通过二部关联图方法实现任务和参与用户的最优匹配;进一步地对用户标注的结果进行融合,运用EM算法迭代估计出任务的真实关联权重;并且根据融合计算的结果和用户标注结果对比评测用户标注的置信度。通过上述提出的机制既能够保证知识资源关联结果融合的质量,又能够真实反映用户的标注态度和能力,给知识资源关联关系挖掘提供了一种新的思路。综合运用上述提出的自动关联和众智关联方法,挖掘出知识和学习资源间的关系,按照知识结构对学习资源进行组织,将知识库和学习资源库构建成一个有机的结构化整体,实现知识和资源的深度聚合。并且基于上述机制设计并实现了知识关联标注系统,完成了众智关联标注模块和主题图知识聚合模块的开发和测试工作。