数据挖掘技术在农业信息服务中的应用研究

来源 :安徽农业大学 | 被引量 : 9次 | 上传用户:heroLi1126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国是一个农业大国,由于农业的基础薄弱,农业信息化水平始终落后于西方发达国家。在我国加入WTO组织之后,农业信息化建设进入了快速发展阶段,农业类网站如雨后春笋般涌现出来。涉农网站中存有大量的农业数据,并且数据每天仍在以指数级的速度增长。但是这些海量数据只是原始信息,包含大量模糊的,不完整的,带有噪声的信息,并不能作为知识被人们直接利用。农业方面的信息很多,有宏观信息、科技信息、市场信息和科学文化信息等。这些信息在农业领域发挥着重要作用。农业信息按照需求和特点,又可以分为季节性信息、地域性信息、综合性信息、时效性信息、多层次信息及创新性信息等。信息的传递依赖于信息载体,农业信息的载体很多。现阶段,我国的农业信息传播的主要载体,有电视、广播、报刊、图书和互联网等大众传媒。每一种载体都有自己的特点,不同的载体相互补充。与广播,电视,电话等传统的农业信息载体相比较,互联网是正在蓬勃发展的新的信息传播载体。目前,农业网站是农业信息的重要载体,通过农业网站传递着海量的农业信息数据,是其他农业信息载体所不能比的。同时,农业网站是开展农业电子商务的重要手段之一,也是农民及相关从业者交流和学习的平台。在农业网站中存在大量的行情土情、作物信息、经验技术和政策法规等原始信息。通过应用数据挖掘技术来解决“信息爆炸,但知识贫乏”的问题,提高农业信息的利用率。Web数据挖掘就是使用数据挖掘技术对Web网页中的数据进行自动抽取、处理和知识发现的过程,根据挖掘对象的不同,Web数据挖掘可以分为Web内容挖掘、Web结构挖掘和Web用户访问模式挖掘三类。相对于传统的数据库来说,Web上的数据不是完全结构化的数据,且不同Web站点的信息组织各不相同。因此,面向Web的数据挖掘技术首先要解决异构数据源问题和半结构化的数据问题。本文把农业网站作为挖掘的数据源,为了更有效地管理和利用通过挖掘得到的农业数据,尝试构建了一种星型结构的农业数据仓库模型,并给出了农业网站数据挖掘的模型系统。农业网站的数据自动抽取技术也是本文研究的难点之一,本文通过分析农业网站Web页面的结构特点,结合HTTP特征介绍了数据抽取的原理,采用正则表达式来设计抽取算法,并对合肥周谷堆批发市场蔬菜价格行情网页的数据进行了抽取实验,实现了对蔬菜价格数据的自动批量抽取,并对抽取到的数据结果,运用时间序列短期预测模型进行了预测分析。
其他文献
兼职教师对补充中等职业学校专业教师数量,提高实践教学水平起到重要作用。兼职教师已然成为中等职业学校师资队伍建设中必不可少的一部分。但是,由于国家教育行政部门缺乏政
本文以机械天平TG328B为研究对象,主要分析了机械天平在检定过程中,各技术参数示值误差测量值的不确定度的来源并结合实际工作中的应用情况,详细介绍了机械天平示值误差测量
说课能力、钢琴伴奏能力、创新能力是高师音乐专业的毕业生从事实际教学所必备的能力,在音乐教学中要注重这些能力的培养。
自清末新政以来,我国的陶瓷教育在西方科技强势文化的影响下,逐渐引入和发展了以学堂、学校为主体的学院式教育模式。在办学宗旨和目标上先后经历了模仿、认知和发展的蜕变。
基于突变理论和模糊数学相结合的突变级数法,提出了冲击地压危险性评价的新指标—突变级数;通过综合考虑冲击地压危险性影响因素,建立了新的冲击地压危险性评价模型;在对各影
鲢鱼(Hypophthalmichthys molitrix)是我国主要的淡水鱼之一,不仅原料来源丰富,而且营养价值高。目前,这类淡水鱼仍以活体运输的鲜销为主,深加工程度较低。鱼丸作为我国传统
目的观察美菲康对中、重度癌痛的镇痛疗效。方法对70例晚期癌痛患者给予美菲康片整片吞服,不可嚼服、碾细或截开,用量取决于疼痛的严重程度和过去使用止痛药的剂量。开始给药
20世纪90年代初,全国政协副主席、原水利电力部部长、中国工程院院士钱正英在为潘家铮著的<春梦秋云录>的序中写道:"一位热爱文学的人,居然成为大坝专家,可见其经历之不寻常.
期刊
  本文在分析近年来客船事故发生原因的基础上,结合温州海域实际情况分析了温州客运安全风险利用综合安全评估的方法建立客运安全风险因素评估模型,对影响客船航行安全的恶劣
中国化妆品市场的活跃很大程度上取决于化妆品品种的丰富多彩。多样化的品种、不断调整的品种结构,极大地满足着消费者的需求。品种、品牌、品值,是一个化妆品企业与消费者直