论文部分内容阅读
如今食品药品安全事故频发,究其原因:一是各个地区检验所发展差距巨大,数据独立存储,格式标准不一,造成数据孤岛,数据资源难以共享;二是相关检验机构没有深入挖掘相关数据的潜在价值,从事后处理转变到事前预警上来。针对这些问题,本文研究了基于模糊分类的食品药品安全评估算法,对海量食品药品检验数据格式标准化,通过分析计算得出风险评估等级,使食品药品的安全问题得到了有效监管和安全预警。论文的主要工作如下:第一,研究了基于模糊分类的食品药品安全评估算法。对相关数据建立了数学模型,计算了检测项综合评价隶属度,通过模式识别判定了检品的质量级别。归纳统计出连续批次各质量等级检品数量所占比例,对各个质量等级检品建立了数据可视化模型,比较次等品变化趋势,结合知识规则,得到综合风险评估结果。第二,开发了基于海量数据分析的食品药品安全检测系统,将云计算、Hadoop计算框架、HDFS分布式文件系统、Map/Reduce的计算框架模型和HBase数据库等相关技术综合应用到食品药品安全检测系统当中,实现了对海量检验数据格式标准化,并通过存储服务器的虚拟化以及数据资源的分布式存储,解决了底层存储设施的空间浪费、负载均衡、动态备份、动态迁移等问题,使得系统性能稳定,且具有较高的可靠性、可扩展性以及良好的交互界面。第三,实验以某发酵乳数据集进行了实验分析,数据集中有20个不同品牌发酵乳,每个品牌20个批次检品,每批次20个样品共计16.8万数据。通过分析计算得出了这20个品牌检品的风险等级。实验结果表明该算法对于食品药品质量风险评估是有效的。本文在所设计构建的基于海量数据分析食品药品安全检测系统,将海量、多样的检测数据进行高效存储,实现大规模复杂检测数据查询的快速和准确响应;通过对现有数据集的分析挖掘,评估检品风险等级,为食品药品安全预警提供数据支持,系统具有一定的实用价值。