聚类分析和主成分回归在工业统计数据中的应用

被引量 : 0次 | 上传用户:zhouwei9471
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前的大环境下,世界经济正在深度调整,国内外的发展环境十分复杂。世界经济正在持续的走缓,而国家正在实行宏观调控来实现经济的发展,工业在一个国家中起着关键的作用。工业是一个国家发展和腾飞的动力,是一个国家重要的一部分经济基础。在今年,我国的工业发展有着重要的机遇,从当前的经济形势的指标来看,我国的就业形势基本平稳,价格的总水平也基本持平,经济在保持着稳速的增长。本文的选题数据来源于《2013年中国统计年鉴》,该年鉴统计了中国自改革开放以来三十多年的汇总多方面的经济数据,并且按照时间、按照地区等多方面划分来研究中国的经济数据。数据挖掘是一门综合性的研究学科,它综合了数学知识、概率知识、数据库知识、生物知识等各种学科的交叉学科,并且在当前社会的经济、数学、生物、科学等多方面的领域里均有着广泛的应用。通过研究《中国统计年鉴》中的工业统计数据和居民消费数据,本文主要建立了两个模型。第一个模型是聚类分析模型。聚类分析是数据挖掘中常用的一种算法,K均值聚类分析是聚类分析中的经典算法。本文使用K均值聚类研究2013年《中国统计年鉴》中的工业统计数据,并对全国31个省市自治区直辖市进行聚类,得到聚类结果,并联系实际情况分析我国不同地域的工业发展。第二个模型是主成分回归模型。主成分分析是一种降维的办法,是利用线性变换将多个变量转化为少数主成分的过程,多元线性回归是利用线性关系将因变量和多个自变量建立起回归的模型的过程。本文将多元线性回归和主成分分析两者相结合起来,建立主成分回归模型,并将这种模型应用到中国统计年鉴中的数据中。工业发展对社会中的人均消费水平有着一定的影响,主成分分析模型就是研究工业统计数据和人均消费水平之间的关系。建立人均消费水平和多个工业统计数据之间的主成分回归模型,首先,将工业统计数据进行主成分分析,然后将人均消费水平和主成分分析的结果建立多元线性回归,得到主成分回归的结果,并与其他回归方法做比较,发现主成分回归的效果比较好。
其他文献
P2P网络借贷,通常称为“人人贷”,是指个体和个体之间通过第三方平台在网络上实现直接借贷的金融模式。概念中涉及两方面,一是资金的出借方,通常为个人,另一个是资金的需求方
蓝莓产业在国际及国内市场上已经展现出巨大潜力,尽管我国的蓝莓产业起步较晚,但最近几年已经成为我国发展最快的新型产业之一。近些年,国内外针对蓝莓中花青素的研究大部分局限
根据1996 年12 月27 日沪宁高速公路上雾的观测资料分析, 揭示了辐射雾的双层结构和爆发性发展的特征, 分析了辐射雾发展的物理过程, 讨论了影响辐射雾生消过程的逆温结构和湍流混合问题
横竖是该出事了,一向老实巴交的王清秀竟敢和伟大领袖唱反调。一句“枪杆子里面出枪子”,使革委会挖出了一个货真价实的历史反革命。铁证如山,面对山谷里那白花花的尸骨,他无
本文主要针对多元化背景下学生多元化的特点,利用侨校的优势进行基于问题解决的研究性学习模式的研究与探索,运用实验研究法、行动研究法等研究方法组织教学改革实践,对教学
我国农村土地主要以农村集体经济组织内部家庭承包方式进行经营管理,发包方为村集体经济组织或村民委员会,承包方则是本集体经济组织的农户。国内外学界对我国土地制度的研究
随着我国政治经济体制改革的深入发展,大政府向小政府的转变,在政府与社会关系转型的进程中,社区逐步承载原先由政府和企事业单位包揽的社会事务,城市居民由“单位人”变为了“社
税收筹划指的是纳税人在税收政策法规指导下,充分行使纳税人权利,对自身涉税行为进行科学合理安排,目的是实现税后利益最大化而采取的税务决策方法。在目前我国税收制度日趋
近年来,随着网络和计算机技术的飞速发展,社会进入了以“大数据”为标志的网络数据时代,近年来,《Nature》和《Science》等国际顶级刊物相继出版专刊来探讨对“大数据”的研究。
山地农业耕作离不开农业运输,山地农业运输的特点是运输量大、运输距离远、道路条件差、劳动强度大,且具有一定的危险性。而农业机械化能大大降低人工劳动强度,简化各个环节,