基于教学资源库构建自动答疑系统问题库的关键技术研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:qjbfg123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国教育信息化建设的不断推进,数字化教育资源库的发展同益成熟,积累了大量知识丰富的教学资源。这些资源基本上采用了基于学科、年级、知识点等组织方式,提供基于“关键字”的查询方式,却无法实现知识点之间的关联,无法提供给学生和老师面向“问题解答”的更加开放的知识内容检索,无法实现更高层次上的对教学资源库内容的信息提取和知识综合。 真正有效的知识获取应该是面向问题的知识获取--针对自然语言的提问给出问题的解答。针对目前已经建构起来的大量优质的教学资源,本文引入了智能答疑系统,将优质的教学资源库作为答案的来源并以此为基础构建问题库。这样一方面可以充分利用已经构建好的优质资源,提高教学资源库的利用效率;另一方面可以方便用户获取想要的知识,解决知识获取的有效性问题。本论文主要对如何在资源库的基础上构建问题库进行了探索。 本论文主要工作包括以下两部分: (1)问句构造。基于教学资源库进行问句抽取。抽取过程中,根据问句抽取的问点信息如时间(分为日期型、相对型和频指型)、地点、人物等信息,在教学资源库句子相应的位置上标注出与问句问点对应的答案信息,将构造出的问句按结构化或半结构化的方式保存到FAQ集中。 (2)问句匹配。当用户进行提问时,将用户提出的问题与FAQ集中的问句进行相似度计算,在FAQ集中找到相似度最高的问句,并将该问句对应的问点答案呈现给用户。 在问句构造部分,本论文主要讨论了问点为时间、地点、人物的问句构造过程,并着重分析了有关时间领域的问句模板和问句构造。在问句匹配部分,本论文构建了问句匹配模型,并对问句匹配过程中涉及到的关键算法做了详细的设计与论证。 实验证明,在教学资源库的基础上构建问题库不仅可以为师生提供“面向问题的解答”,提高教学资源库的利用率,而且对提高答案的精确度也是有益的。
其他文献
中国书法与绘画(简称书画)历史悠久,源远流长,是中国传统艺术中一朵艳丽的奇葩,也是世界艺术史上不可多得的瑰宝。其中书法艺术把笔墨精神发挥得淋漓尽致,充分体现了水墨艺术的灵
信息抽取就是将无结构化的信息转换为结构化或者半结构化信息的过程。目前大部分信息抽取系统是从文本中抽取特定的实体信息,包括时间、机构、地点等。自然文本中不仅蕴含了大
随着计算机技术的迅速发展,企业越来越依赖于计算机系统和网络技术,需要企业服务器为客户连续的提供服务。高可用性(High Availability,HA)越来越受到人们的重视。尤其是近年
本文以中国移动通信机房动力环境集中监控系统规范为蓝本,参照了国内外监控系统的最新思想,并针对旧系统的缺点,对动力环境监控系统的配置管理模块以及数据采集模块进行升级
学位
本文研究了三角网格模型的逆向细分问题。由于密集三角网格模型数据量很大,使得其在很多应用中受到限制,例如网络方面的应用中,不适宜传输密集三角网格模型,所以有必要研究密集三
领域工程是软件复用研究的一个重要方向。领域工程侧重在一个领域内系统性的、有计划的复用。其基本思想是通过领域分析,领域设计,领域实现等阶段开发出领域核心资产库;在开发应
软件质量是软件使用者最为关心的问题之一,如何控制软件质量,开发出高质量的软件成为软件可靠性研究领域的热点。有效的软件质量预测可以在软件生命过程早期指导建立高效可靠的
数据挖掘是近年来随数据库和人工智能发展起来的新技术,其目的是从大量的、不完全的、有噪声的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知
随着互联网的快速发展,用户对高质量视频的需求正不断增长,视频通信业务正经历着持续的发展。然而由于信道拥塞、延迟等原因造成的比特错误和分组丢失现象,视频流在传输过程