论文部分内容阅读
水产养殖是农业的重要组成部分,多年来产量处于是世界首位,是一个不断发展的综合性研究领域。为了深入了解水产养殖业发展现状及发展趋势,以及渔民喂养方式和获取信息途径,我们前往“浙江省淡水水产研究所八里店实验综合基地”实地调研,通过一个月的实地观察以及工作人员和周围养殖户的反馈,我们发现养殖户多以经验养殖为主,养殖技术以及鱼病预防等措施更新不及时,遇到问题虽通过网络途径查询,却出现各种错综复杂的信息,导致养殖户不能很好的汲取有用信息,这是水产养殖行业普遍存在的一大问题。基于知识图谱的问答系统就能很好地解决这个问题。针对目前水产养殖领域出现的问题,本文主要研究方面如下:
(1)通过对水产养殖知识图谱问答系的相关知识进行整理,并对其相关技术和理论基础进行了研究,主要包括网络爬虫技术、实体识别以及关系抽取等。
(2)水产养殖知识图谱构建:运用网络爬虫技术对百度百科、国家农业科学数据共享中心渔业科学数据分中心的数据进行爬取,并存储在MySQL数据库中,以备接下来的研究做好充足的数据准备。通过对爬取到的水产养殖信息进行格式化转换成csv文件,将实体及关系文件进行批量导入到Neo4j图数据库中,并进行可视化展示。
(3)知识图谱问答系统分析及算法设计:对本文需要构建的知识图谱问答系统进行需求分析和可行性分析,并根据BiLSTM-CRF命名实体识别和融合注意力机制的CNN属性链接算法进行问答实验,结果显示此算法比较适用于此次研究。
(4)知识图谱问答系统的设计与实现:此问答系统前端页面采用bootstrap框架设计,通过Echart进行知识展示,同时基于python轻量级web框架开发,通过对搜索结果的展示,可以看出本文提出的基于知识图谱的水产养殖知识问答系统能够实现实时分析用户的问答路径,给用户提供可靠信息。
本文构建了水产养殖知识图谱,并开发了基于水产养殖知识图谱的问答系统。用户通过该系统可以准确获得所需知识,且无需浏览大量网页,这为用户获取与水产养殖相关的知识提供了极大的便利。
(1)通过对水产养殖知识图谱问答系的相关知识进行整理,并对其相关技术和理论基础进行了研究,主要包括网络爬虫技术、实体识别以及关系抽取等。
(2)水产养殖知识图谱构建:运用网络爬虫技术对百度百科、国家农业科学数据共享中心渔业科学数据分中心的数据进行爬取,并存储在MySQL数据库中,以备接下来的研究做好充足的数据准备。通过对爬取到的水产养殖信息进行格式化转换成csv文件,将实体及关系文件进行批量导入到Neo4j图数据库中,并进行可视化展示。
(3)知识图谱问答系统分析及算法设计:对本文需要构建的知识图谱问答系统进行需求分析和可行性分析,并根据BiLSTM-CRF命名实体识别和融合注意力机制的CNN属性链接算法进行问答实验,结果显示此算法比较适用于此次研究。
(4)知识图谱问答系统的设计与实现:此问答系统前端页面采用bootstrap框架设计,通过Echart进行知识展示,同时基于python轻量级web框架开发,通过对搜索结果的展示,可以看出本文提出的基于知识图谱的水产养殖知识问答系统能够实现实时分析用户的问答路径,给用户提供可靠信息。
本文构建了水产养殖知识图谱,并开发了基于水产养殖知识图谱的问答系统。用户通过该系统可以准确获得所需知识,且无需浏览大量网页,这为用户获取与水产养殖相关的知识提供了极大的便利。