论文部分内容阅读
【摘要】采集权威机构的统计数据,利用统计分析工具--SPSS软件,构建因子分析和聚类分析模型,对四川省各地区的科技实力进行合理的分析评价。
【关键词】SPSS 因子分析;聚类分析;科技实力
1.地区科技实力评价体系及方法
科技实力(The capability of S&T),指的是在一定的生产力系统中,在现有科技资源基础上,进行科技活动,发挥效能,取得产出,促进社会、经济、科技全面发展的总和能力。具体包括科技潜力和科技实际能力两个方面。其内涵至少有四个方面:
"一是科技基础;
"二是科技投入力;
"三是科技产出力;
"四是科技对社会经济发展的影响力。
一般而言,可将前两者视为科技潜力,将后两者视为科技实际能力。由于其在前一时期的科技实际能力又将构成以后时期的科技潜力的重要源泉,因此,科技实力实际上是一个动态的概念[1]。
目前,评价方法多采用指标体系综合评价法,基本步骤如下:
(1)运用科学的方法研究或权威机构的认可,确定若干项全面反映评价对象各个侧面的指标 ,构成指标体系 ,作为评价的依据;
(2)取得评价对象的评价指标数据 ,然后采用适当的方法对原始数据进行标准化处理;
(3)根据各项评价指标在反映评价对象科技综合实力方面的地位和作用 ,采取适当的方法确定各项评价指标的权重系数 ,形成权重体系;
(4)在此基础上根据权重系数对标准化处理后的数据进行加权综合 ,获得对评价对象的综合评价数值,并进行评价、排序和分析[2] [3] 。
2.统计分析预处理
数据来源于《四川统计年鉴-2007》中教育、科技和专利里的数据,从所给出的统计指标中选取了一部分反映科技实力的指标,如科技投入、产出以及规模等方面的指标来作分析评估。最终选取四川省21个地区的如下13个指标[4] :
(1)有科技活动的机构数(个);(2)机构科技经费内部支出(万元);(3)科技活动人员数(个);(4)科学家和工程师人数(个);(5)科技活动经费筹集额(万元);(6)科技活动经费支出(万元);(7)科技项目(课题)数(项);(8)项目活动科学家和工程师(人);(9)项目实际经费支出(万元);(10)R&D人员折合全时人员(人年);(11)R&D活动科学家和工程师(人);(12)R&D活动经费内部支出(万元;(13)R&D活动经常经费支出(万元)
参照目前国内外关于科技实力的评价方法,本文采用因子分析、聚类分析来评价。分析框架如下[5] [6]:
(1)因子分析:因子分析是研究相关矩阵内部依存关系,将多个变量x1 , x2 , …, xp 可以观测的随机变量,也即显在变量综合为少数几个因子 F1 , F 2, …, Fm 不可观测的潜在变量 以再现指标与因子之间的相关关系的一种统计方法。
(2)聚类分析:根据科技实力情况对各地区进行聚类,把科技实力相差不远的地区聚为一类。采用聚类分析方法,将四川省21个地区的科技实力水平分为3~4类,便于针对不同地区科技实力水平采取相应政策。
3.统计分析过程
3.1因子分析
对指标中的相应数据进行因子分析,首先对数据进行标准化,消除不同变量对分析的影响。具体的分析步骤为[7]:
(1)标准化数据;
(2)检验是否可以作因子分析;变量之间的相关性检验,采用KMO样本测度、巴特莱特球体检验。结果显示:KMO值为0.811,位于0.8~0.9,很适合作因子分析。表中巴特莱特球体检验的统计量显著性概率是0.000,说明变量之间有相关性,适宜作因子分析。
(3)确定需提取的公共因子个数。通过SPSS分析,结果中前两个因子所占方差的累积比例已达到99.045%,已几乎包含了全部指标具有的基本信息,故选择提取出两个公共因子,作为综合的评价指标。
(4)对提取出的公共因子分析。由分析结果中的负载数据可以得到因子1与因子2分别影响较大的指标为:
因子一:
机构科技经费内部支出(万元);
科技活动经费筹集额(万元);
科技活动经费支出(万元);
项目实际经费支出(万元);
R&D活动经费内部支出(万元);
R&D活动经常经费支出(万元)。
因子二:
有科技活动的机构数(个);
科技活动人员数(个);
科学家和工程师人数(个);
科技项目(课题)数(项);
项目活动科学家和工程师(人);
R&D人员折合全时人员(人年);
R&D活动科学家和工程师(人)。
可以看出因子1主要对资金相关的指标影响较大,而因子2主要对规模相关的指标影响较大。所以可以命名因子1为"资金因子",因子2为"规模因子"。
(5)评价
以各因子的方差贡献率为权重,得到综合评价指标函数:
并由此得到个地区的排序结果。
从SPSS的排序结果来看,成都市得分第一,并且遥遥领先于其它地区;绵阳市的得分也比其它地区要高很多。而后面那些地区的得分都相差不大。也就是成都市、绵阳市的科技水平与其它地区有较大差别,比其它地区都要强很多。
3.2聚类分析[8]
采用k-均值聚类法,得出如下分类:
分三类:
第一类:成都市;
第二类:德阳市,宜宾市,攀枝花市,南充市,自贡市,泸州市,内江市,乐山市,遂宁市,雅安市,资阳市,眉山市,达州市,广元市,凉山彝族自治州,巴中市,广安市,甘孜藏族自治州,阿坝藏族羌族自治州;
第三类:绵阳市。
分四类:
第一类:成都市;
第二类:德阳市,宜宾市,攀枝花市;
第三类:绵阳市;
第四类:南充市,自贡市,泸州市,内江市,乐山市,遂宁市,雅安市,资阳市,眉山市,达州市,广元市,凉山彝族自治州,巴中市,广安市,甘孜藏族自治州,阿坝藏族羌族自治州。
从聚类结果来看,无论是聚为三类还是聚为四类,都是成都市、绵阳市单独为一类,这说明这两个地区与其它地区的科技实力水平确实差距较大,与前面描述统计及因子分析部分得出的结论是相一致的。如果聚为三类,德阳市、宜宾市和攀枝花市聚为一类,说明这三个地区的科技实力水平相对于其余的地区来说要稍强一些,但是差别也不是太大,没有与成都市、绵阳市的差别那么大。

3.3 綜合分析
综合前面的因子分析和聚类分析,结果归纳如下:
聚类的结果与因子分析结果一致,聚类分析的结果将排名接近的几个聚为一类了。但由以上的分析表明,除了成都市和绵阳市以外,其它各地区差别都不是太大,所以分为四类的第二类和第四类其实科技实力水平差别不是很大,在措施、政策方面可以看作一类,即采取基本相同的措施、政策来促进其科技实力水平的发展进步。
4.结论
综上,根据对各地区科技实力水平进行上面的分析,可以将四川省21个地区的科技实力总体水平分为三类,以针对不同的科技实力发展情况采取相应的政策[9]:
第一类地区为成都市,由于成都市是四川省省会,在科研力量的基础和科技活动的投入优势都遥遥领先于其它地区。成都市高校及科研单位比其它地区多很多,科技发展整个体系、环境、设备都很优越,科研力量上进步又比较快,吸引较多的优秀人才,推动科研实力的提高和经济的发展。
第二类地区包括德阳市,宜宾市,攀枝花市,南充市,自贡市,泸州市,内江市,乐山市,遂宁市,雅安市,资阳市,眉山市,达州市,广元市,凉山彝族自治州,巴中市,广安市,甘孜藏族自治州,阿坝藏族羌族自治州。这些地区经济的发展就比较落后,在科研上的投入少,是处于科技水平很低的地区。有待于进一步发展提高,进而推动其经济的发展进步。
第三类地区为绵阳市,绵阳是四川省第二大城市,也是国家重要的国防军工科研生产基地,有中国工程物理研究院、中国空气动力研究与发展中心、西南自动化研究所、中国燃气涡轮研究所等国防研究院所18家,有很好的技术基础。因而绵阳市为四川省两个技术创新试点城市之一,为推动四川省科技进步的重要力量。
5.评估效果评价和价值
总体上来说,评估效果比较符合实际情况,因子分析得出的各地区排序位次与聚类分析结果也一致,所以评价效果较好。这种评价的方法也可以用于全国各省各个主要城市科研能力评价、区域经济以及其它方面的发展评价、竞争力综合评价以及其它方面的评价分析。从上面聚类与因子分析的结果,可以看出,科技实力和经济实力是正相关的关系,科技实力越强,经济实力就越强;经济实同时也影响着科技实力。
【参考文献】
[1].冯振环.地区科技实力的评价方法研究 [J].科学管理研究,2002(4)
[2].侯仁勇,高艳.中部区域科技能力评价及 SWOT分析 [J].科学学与科学技术管理,2004 (9)
[3].张力.区域科技进步综合评价体系研究.科技进步与对策,1999(6)
[4].国家统计局编.四川省统计年鉴--2007[M ].北京:中国统计出版社,2007
[5].刘树、李荣平、李林杰.科技进步综合评价研究.石家庄:河北大学出版社,2000
[6].游光荣,狄承锋.我国地区科技竞争力研究.中国软科学,2001
[7].叶双峰. 关于主成分分析做综合评价的改进 . 数据统计与管理, 2001(2)
[8].卢纹岱.统计分析.电子工业出版社,2000:410-420
[9].刘世庆. 中国西部大开发与经济转型[M] . 经济科学出版社, 2003
作者简介:赵永超,(1984--),女,四川大学06级情报学在读研究生
【关键词】SPSS 因子分析;聚类分析;科技实力
1.地区科技实力评价体系及方法
科技实力(The capability of S&T),指的是在一定的生产力系统中,在现有科技资源基础上,进行科技活动,发挥效能,取得产出,促进社会、经济、科技全面发展的总和能力。具体包括科技潜力和科技实际能力两个方面。其内涵至少有四个方面:
"一是科技基础;
"二是科技投入力;
"三是科技产出力;
"四是科技对社会经济发展的影响力。
一般而言,可将前两者视为科技潜力,将后两者视为科技实际能力。由于其在前一时期的科技实际能力又将构成以后时期的科技潜力的重要源泉,因此,科技实力实际上是一个动态的概念[1]。
目前,评价方法多采用指标体系综合评价法,基本步骤如下:
(1)运用科学的方法研究或权威机构的认可,确定若干项全面反映评价对象各个侧面的指标 ,构成指标体系 ,作为评价的依据;
(2)取得评价对象的评价指标数据 ,然后采用适当的方法对原始数据进行标准化处理;
(3)根据各项评价指标在反映评价对象科技综合实力方面的地位和作用 ,采取适当的方法确定各项评价指标的权重系数 ,形成权重体系;
(4)在此基础上根据权重系数对标准化处理后的数据进行加权综合 ,获得对评价对象的综合评价数值,并进行评价、排序和分析[2] [3] 。
2.统计分析预处理
数据来源于《四川统计年鉴-2007》中教育、科技和专利里的数据,从所给出的统计指标中选取了一部分反映科技实力的指标,如科技投入、产出以及规模等方面的指标来作分析评估。最终选取四川省21个地区的如下13个指标[4] :
(1)有科技活动的机构数(个);(2)机构科技经费内部支出(万元);(3)科技活动人员数(个);(4)科学家和工程师人数(个);(5)科技活动经费筹集额(万元);(6)科技活动经费支出(万元);(7)科技项目(课题)数(项);(8)项目活动科学家和工程师(人);(9)项目实际经费支出(万元);(10)R&D人员折合全时人员(人年);(11)R&D活动科学家和工程师(人);(12)R&D活动经费内部支出(万元;(13)R&D活动经常经费支出(万元)
参照目前国内外关于科技实力的评价方法,本文采用因子分析、聚类分析来评价。分析框架如下[5] [6]:
(1)因子分析:因子分析是研究相关矩阵内部依存关系,将多个变量x1 , x2 , …, xp 可以观测的随机变量,也即显在变量综合为少数几个因子 F1 , F 2, …, Fm 不可观测的潜在变量 以再现指标与因子之间的相关关系的一种统计方法。
(2)聚类分析:根据科技实力情况对各地区进行聚类,把科技实力相差不远的地区聚为一类。采用聚类分析方法,将四川省21个地区的科技实力水平分为3~4类,便于针对不同地区科技实力水平采取相应政策。
3.统计分析过程
3.1因子分析
对指标中的相应数据进行因子分析,首先对数据进行标准化,消除不同变量对分析的影响。具体的分析步骤为[7]:
(1)标准化数据;
(2)检验是否可以作因子分析;变量之间的相关性检验,采用KMO样本测度、巴特莱特球体检验。结果显示:KMO值为0.811,位于0.8~0.9,很适合作因子分析。表中巴特莱特球体检验的统计量显著性概率是0.000,说明变量之间有相关性,适宜作因子分析。
(3)确定需提取的公共因子个数。通过SPSS分析,结果中前两个因子所占方差的累积比例已达到99.045%,已几乎包含了全部指标具有的基本信息,故选择提取出两个公共因子,作为综合的评价指标。
(4)对提取出的公共因子分析。由分析结果中的负载数据可以得到因子1与因子2分别影响较大的指标为:
因子一:
机构科技经费内部支出(万元);
科技活动经费筹集额(万元);
科技活动经费支出(万元);
项目实际经费支出(万元);
R&D活动经费内部支出(万元);
R&D活动经常经费支出(万元)。
因子二:
有科技活动的机构数(个);
科技活动人员数(个);
科学家和工程师人数(个);
科技项目(课题)数(项);
项目活动科学家和工程师(人);
R&D人员折合全时人员(人年);
R&D活动科学家和工程师(人)。
可以看出因子1主要对资金相关的指标影响较大,而因子2主要对规模相关的指标影响较大。所以可以命名因子1为"资金因子",因子2为"规模因子"。
(5)评价
以各因子的方差贡献率为权重,得到综合评价指标函数:
并由此得到个地区的排序结果。
从SPSS的排序结果来看,成都市得分第一,并且遥遥领先于其它地区;绵阳市的得分也比其它地区要高很多。而后面那些地区的得分都相差不大。也就是成都市、绵阳市的科技水平与其它地区有较大差别,比其它地区都要强很多。
3.2聚类分析[8]
采用k-均值聚类法,得出如下分类:
分三类:
第一类:成都市;
第二类:德阳市,宜宾市,攀枝花市,南充市,自贡市,泸州市,内江市,乐山市,遂宁市,雅安市,资阳市,眉山市,达州市,广元市,凉山彝族自治州,巴中市,广安市,甘孜藏族自治州,阿坝藏族羌族自治州;
第三类:绵阳市。
分四类:
第一类:成都市;
第二类:德阳市,宜宾市,攀枝花市;
第三类:绵阳市;
第四类:南充市,自贡市,泸州市,内江市,乐山市,遂宁市,雅安市,资阳市,眉山市,达州市,广元市,凉山彝族自治州,巴中市,广安市,甘孜藏族自治州,阿坝藏族羌族自治州。
从聚类结果来看,无论是聚为三类还是聚为四类,都是成都市、绵阳市单独为一类,这说明这两个地区与其它地区的科技实力水平确实差距较大,与前面描述统计及因子分析部分得出的结论是相一致的。如果聚为三类,德阳市、宜宾市和攀枝花市聚为一类,说明这三个地区的科技实力水平相对于其余的地区来说要稍强一些,但是差别也不是太大,没有与成都市、绵阳市的差别那么大。

3.3 綜合分析
综合前面的因子分析和聚类分析,结果归纳如下:
聚类的结果与因子分析结果一致,聚类分析的结果将排名接近的几个聚为一类了。但由以上的分析表明,除了成都市和绵阳市以外,其它各地区差别都不是太大,所以分为四类的第二类和第四类其实科技实力水平差别不是很大,在措施、政策方面可以看作一类,即采取基本相同的措施、政策来促进其科技实力水平的发展进步。
4.结论
综上,根据对各地区科技实力水平进行上面的分析,可以将四川省21个地区的科技实力总体水平分为三类,以针对不同的科技实力发展情况采取相应的政策[9]:
第一类地区为成都市,由于成都市是四川省省会,在科研力量的基础和科技活动的投入优势都遥遥领先于其它地区。成都市高校及科研单位比其它地区多很多,科技发展整个体系、环境、设备都很优越,科研力量上进步又比较快,吸引较多的优秀人才,推动科研实力的提高和经济的发展。
第二类地区包括德阳市,宜宾市,攀枝花市,南充市,自贡市,泸州市,内江市,乐山市,遂宁市,雅安市,资阳市,眉山市,达州市,广元市,凉山彝族自治州,巴中市,广安市,甘孜藏族自治州,阿坝藏族羌族自治州。这些地区经济的发展就比较落后,在科研上的投入少,是处于科技水平很低的地区。有待于进一步发展提高,进而推动其经济的发展进步。
第三类地区为绵阳市,绵阳是四川省第二大城市,也是国家重要的国防军工科研生产基地,有中国工程物理研究院、中国空气动力研究与发展中心、西南自动化研究所、中国燃气涡轮研究所等国防研究院所18家,有很好的技术基础。因而绵阳市为四川省两个技术创新试点城市之一,为推动四川省科技进步的重要力量。
5.评估效果评价和价值
总体上来说,评估效果比较符合实际情况,因子分析得出的各地区排序位次与聚类分析结果也一致,所以评价效果较好。这种评价的方法也可以用于全国各省各个主要城市科研能力评价、区域经济以及其它方面的发展评价、竞争力综合评价以及其它方面的评价分析。从上面聚类与因子分析的结果,可以看出,科技实力和经济实力是正相关的关系,科技实力越强,经济实力就越强;经济实同时也影响着科技实力。
【参考文献】
[1].冯振环.地区科技实力的评价方法研究 [J].科学管理研究,2002(4)
[2].侯仁勇,高艳.中部区域科技能力评价及 SWOT分析 [J].科学学与科学技术管理,2004 (9)
[3].张力.区域科技进步综合评价体系研究.科技进步与对策,1999(6)
[4].国家统计局编.四川省统计年鉴--2007[M ].北京:中国统计出版社,2007
[5].刘树、李荣平、李林杰.科技进步综合评价研究.石家庄:河北大学出版社,2000
[6].游光荣,狄承锋.我国地区科技竞争力研究.中国软科学,2001
[7].叶双峰. 关于主成分分析做综合评价的改进 . 数据统计与管理, 2001(2)
[8].卢纹岱.统计分析.电子工业出版社,2000:410-420
[9].刘世庆. 中国西部大开发与经济转型[M] . 经济科学出版社, 2003
作者简介:赵永超,(1984--),女,四川大学06级情报学在读研究生