论文部分内容阅读
[摘 要]本文针对葡萄酒、葡萄理化指标和葡萄酒质量的相关性进行一系列建模从而对酿酒葡萄分级。首先通过主成分分析法滤去葡萄、葡萄酒中影响较小的理化指标,然后利用多元线性回归分析把红、白葡萄的主成分和评酒员的质量评价建立函数统一起来,根据函数实现对葡萄的分级。
[关键词]酿酒葡萄的分级、主成分分析、多元线性回归分析、SPSS
中图分类号:T9 文献标识码:A 文章编号:1009-914X(2015)13-0330-01
不同质量的葡萄所酿葡萄酒品质不同,所以对酿酒葡萄的分级要从两方面考虑:葡萄的理化指标、葡萄酒的质量。对于前者,把葡萄的30种一级指标用主成分分析法求解,用较少的重要指标来代替原来较多的指标。对于第二方面,利用附件一中品酒员的评分进行分析。最后利用多元线性回归分析把两者统一起来,构建一个综合的分级标准进行分级。具体步骤如下:
(1)考虑葡萄的理化指标,我们先观察附件2里红、白葡萄的化学物质。由于成分较多,不利于分析统计,我们先对30种一级指标利用SPSS进行主成分分析,降维,减少考虑的因子个数。得到了红葡萄的8个主成分及白葡萄的9个主成分。
(2)考虑葡萄酒质量,我们根据附录一,用每组品酒员对酒样品的评价总分数来分析。因为第二组品酒员比第一组可信,所以采用第二组品酒员的评价分数。
(3)以第二组评酒师的评价分数为因变量,葡萄的各项主成分为自变量,建立如下形式的函数模型:
红葡萄酒:Y=a1x1+a2x2-a3x3+a4x4-a5x5+a6x6+a7x7-a8x8+a9
白葡萄酒:Y=b1x1+b2x2-b3x3+b4x4-b5x5+b6x6+b7x7-b8x8+b9x9+b10
(4)利用SPSS的多元线性回归分析对模型求解(表1)。
a.因变量:二红评分
得到品酒员评价分数与红葡萄主成分之间的关系为:Y=11.822x1+0.733x2-8.087
x3+1.247x4-0.180x5+4.166x6+2.622x7-0.281x8+70.485
(5)利用回归分析所得到的式子,可以由主成分得到酿酒红葡萄所酿红葡萄酒的预期评分y,结果如(表2)。
(6)通过酿酒葡萄所酿酒的预期评分y对酿酒红葡萄进行分级,规定每级分数间隔区间范围:红葡萄为3。得到分级结果:
一级(80-77):样本9;二级(77-74):样本23、3、2;三级(74-71)20、21、19、17、10、5、13;四级(71-68):22、12、15、25、26、24、27、16、6、14;五级(68-65):8、11、18、1、7、4。
(7)同理,得到白葡萄酒的品酒员评价分数与主成分之间的关系为:y=0.838x1-0.021x2-0.831x3+0.853x4-0.901x5+1.081x6-0.477x7-1.578x8+0.679x9+76.532。
并由此得到预期评分,确定每级分数范围11,得到分级结果:
一级(95-84):20、3、5、27;二级(84-73):26、25、9、24、29;三级(73-62:22、17、21、12、19、15、6、4、23、10、2;四级(62-51):16、18、14、8、7、1、11;五级(51-40):13。
参考文献
[1] 李运;李记明;姜忠军,《统计分析在葡萄酒质量评价中的应用》,北京:酿酒科技,2009年.
[2] 王雪华,《管理统计学》,北京:电子工业出版社,2011年.
作者简介
宿爱静,女,1993年生,汉族,黑龙江哈尔滨人,南京农业大学工学院大三学生。
[关键词]酿酒葡萄的分级、主成分分析、多元线性回归分析、SPSS
中图分类号:T9 文献标识码:A 文章编号:1009-914X(2015)13-0330-01
不同质量的葡萄所酿葡萄酒品质不同,所以对酿酒葡萄的分级要从两方面考虑:葡萄的理化指标、葡萄酒的质量。对于前者,把葡萄的30种一级指标用主成分分析法求解,用较少的重要指标来代替原来较多的指标。对于第二方面,利用附件一中品酒员的评分进行分析。最后利用多元线性回归分析把两者统一起来,构建一个综合的分级标准进行分级。具体步骤如下:
(1)考虑葡萄的理化指标,我们先观察附件2里红、白葡萄的化学物质。由于成分较多,不利于分析统计,我们先对30种一级指标利用SPSS进行主成分分析,降维,减少考虑的因子个数。得到了红葡萄的8个主成分及白葡萄的9个主成分。
(2)考虑葡萄酒质量,我们根据附录一,用每组品酒员对酒样品的评价总分数来分析。因为第二组品酒员比第一组可信,所以采用第二组品酒员的评价分数。
(3)以第二组评酒师的评价分数为因变量,葡萄的各项主成分为自变量,建立如下形式的函数模型:
红葡萄酒:Y=a1x1+a2x2-a3x3+a4x4-a5x5+a6x6+a7x7-a8x8+a9
白葡萄酒:Y=b1x1+b2x2-b3x3+b4x4-b5x5+b6x6+b7x7-b8x8+b9x9+b10
(4)利用SPSS的多元线性回归分析对模型求解(表1)。
a.因变量:二红评分
得到品酒员评价分数与红葡萄主成分之间的关系为:Y=11.822x1+0.733x2-8.087
x3+1.247x4-0.180x5+4.166x6+2.622x7-0.281x8+70.485
(5)利用回归分析所得到的式子,可以由主成分得到酿酒红葡萄所酿红葡萄酒的预期评分y,结果如(表2)。
(6)通过酿酒葡萄所酿酒的预期评分y对酿酒红葡萄进行分级,规定每级分数间隔区间范围:红葡萄为3。得到分级结果:
一级(80-77):样本9;二级(77-74):样本23、3、2;三级(74-71)20、21、19、17、10、5、13;四级(71-68):22、12、15、25、26、24、27、16、6、14;五级(68-65):8、11、18、1、7、4。
(7)同理,得到白葡萄酒的品酒员评价分数与主成分之间的关系为:y=0.838x1-0.021x2-0.831x3+0.853x4-0.901x5+1.081x6-0.477x7-1.578x8+0.679x9+76.532。
并由此得到预期评分,确定每级分数范围11,得到分级结果:
一级(95-84):20、3、5、27;二级(84-73):26、25、9、24、29;三级(73-62:22、17、21、12、19、15、6、4、23、10、2;四级(62-51):16、18、14、8、7、1、11;五级(51-40):13。
参考文献
[1] 李运;李记明;姜忠军,《统计分析在葡萄酒质量评价中的应用》,北京:酿酒科技,2009年.
[2] 王雪华,《管理统计学》,北京:电子工业出版社,2011年.
作者简介
宿爱静,女,1993年生,汉族,黑龙江哈尔滨人,南京农业大学工学院大三学生。