基于机器学习的空气质量分析与预测

来源 :石家庄铁道大学 | 被引量 : 0次 | 上传用户:yhl0921
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着雾霾天气的增多,公众的注意力逐渐聚焦到空气质量上来,目前空气质量已经成为社会与大众共同关注的环境问题之一。污染源的分布、气象因素和污染物的类型等多种因素影响着城市空气中污染物浓度的高低,不同的城市污染物浓度的分布特征不同。因此,深入讨论污染物浓度之间的关系和气象因素与污染物浓度之间的关系,预测PM2.5的浓度,对研究城市环境污染、空气质量问题及研究对于这类问题有效的预防措施具有十分重要的意义。本文以“基于空气质量监测大数据的污染物分布建模技术研究与应用”课题为背景,以空气污染物浓度为研究对象,提出了一种基于ARIMA-SVM的PM2.5浓度预测模型,以提高PM2.5浓度预测的准确率;并在此基础上实现了空气污染物监测原型系统。主要研究内容包括:(1)空气污染物数据的预处理:针对数据中含有缺失值的问题,利用多重插补法填补缺失值;利用机器学习中的K-means聚类算法识别异常值,由六种污染物数据生成标签,再将数据根据聚类中心进行聚类,将异常点删除。以此整理出质量较高且具有代表性的数据。(2)属性间相关性分析:利用Spearman秩相关系数分析污染物之间的相关性、污染物与气象因素之间的相关性;构建PM2.5浓度分别与其它五项污染物浓度间的线性回归模型,验证通过Spearman秩相关系数得到的结论。(3)构建PM2.5浓度预测模型:重点研究了ARIMA、SVM算法,并将这两种算法结合,构建了基于ARIMA-SVM的PM2.5浓度预测模型。该模型将SVM与ARIMA结合,弥补了传统的ARIMA时间序列预测不能处理非线性数据的不足之处,提高了预测的准确率;同时构建了基于Keras的LSTM神经网络模型预测PM2.5浓度;将ARIMA-SVM组合模型与LSTM模型进行了对比分析。(4)空气污染物监测原型系统:利用Pycharm、Hbuilder等工具设计并实现了空气污染物监测系统。系统实现了城市搜索、城市AQI指数排名、城市各个检测点污染物浓度以及AQI变化趋势等功能。
其他文献
一个企业的发展历程往往是跌荡起伏、枯荣相伴.企业亏损是常见的,但要找到"病灶"才是关键,否则扭亏无望.
日前,北京市住建委发布通知,为进一步强化对公租房违规家庭的信用约束,公租房只能用于符合条件的申请家庭自住,对于存在转租转借、空置、擅自装修等违规使用的家庭,房屋行政
随着信息会计的逐步实施,企业会计核算与会计管理的内部、外部环境发生了巨大变化,传统会计电算化系统的内部控制机制和手段很难适应信息环境,建立适应于信息环境下的内部控制体
智能配网系统是利用现代电子技术、通讯技术、计算机及网络技术,将配电网在线数据和离线数据、配电网数据和用户数据、电网结构和地理图形进行信息集成,实现配电系统正常运行
类型:家庭个案调查报告(Sociology of family)主题:反映从文化大革命时期,到改革开放新时期广东一线城镇居民生活状态的变化,反映家庭社会学的部分理论与内容。
随着竞争日益加剧,组织外在环境的不确定性加强,战咯联盟、业务外包、兼并和重组、组织扁平化等策略的运用,使得组织有可能不愿意或者没有能力实现对组织成员的承诺,从而使组
本文提出了一种活齿传动内齿廓生成的方法,论证了该方法生成的内齿廓满足齿廓啮合基本定律及连续啮合条件,并找出了活齿与内齿之间的齿数关系。
我院2000~2001年共收治睾丸附件扭转3例,均经手术证实,占同期阴囊急症的60%.国外报道[1]63例急性阴囊疼痛患儿,其中附件扭转39例,睾丸扭转21例.提示睾丸附件扭转发生率偏高,应
自行车在欧洲已上升为“绿色环保交通工具”,欧洲人不但视自行车为环保的交通工具用来代步出行,而且越来越多的人将自行车作为健身器材来骑行锻炼和用自行车出游。