基于典型数据集的数据预处理方法对比分析

来源 :沈阳工业大学学报 | 被引量 : 0次 | 上传用户:yucol
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多种数据预处理方式及其组合如何提升模型拟合效果这一问题,基于UCI Machine Learning Repository典型数据集,分别利用20种变量处理方式和4种变量选择方法对数据预处理,并对模型拟合效果对比分析,分别考查了多种数据预处理方式及其组合对常见分类模型和回归模型的影响.通过对实验结果的分析讨论,提出一种启发式算法,根据数据特征、模型特点以及研究问题种类等信息推荐数据预处理方法.在更广泛的数据集上的实验结果表明,该算法所推荐的数据预处理方法可以一定程度上提升模型拟合效果,节省手工选取数据预处理方法的开销.
其他文献
为了准确测量钨材料和氧化铝材料在高温下的热导率,对样品的密度、比热和热扩散系数进行了测量并评估了数据的准确性和重复性,分析了样品的理论比热、差式扫描量热法(DSC)比热和激光导热仪(LFA)比热对热导率计算的影响.结果表明:不论是DSC法还是LFA法,钨材料的比热数据均会导致其热导率产生较大的偏差,故在计算其热导率时可代入理论比热进行计算;通过DSC法测量得到的氧化铝陶瓷的比热较为准确,且可以提高热导率数据计算的准确性.
为了研究室温条件下6016-T4铝合金板材的高应变速率变形行为,采用分离式霍普金森压杆(SHPB)设备进行应变速率为1600、2300和3200 s-1的压缩变形实验,建立描述材料变形行为的Johnson-Cook本构模型,应用ABAQUS软件进行热力耦合仿真模拟,研究实验过程中合金的变形和温度场变化规律.结果表明:在6016-T4铝合金板材室温高应变速率压缩变形过程中,当应变速率较高时,合金表现出负应变速率敏感性;通过Johnson-Cook本构模型计算出的数据与实验数据吻合良好;通过仿真模拟可知,合金
为了模拟单颗粒金刚石磨削碳化硅陶瓷的加工过程,采用控制单一变量的方法,设置同一条件下不同工件进给速度的工艺参数,用Johnson-Holmquist ceramic本构关系建立有限元模型,仿真分析不同工件进给速度下单粒金刚石磨削碳化硅陶瓷的磨削力、磨削表面应力、磨削表面形貌和裂纹损伤.仿真模型数据与已有相同工况下的单粒金刚石磨削碳化硅陶瓷实验值吻合度较高,所提出的数值模型为金刚石砂轮设计、预测陶瓷磨削的磨削力、切屑去除和观察划痕形貌提供了高效的方法和理论依据.
为了准确、有效、实时估计智能电网中配电网线损,提出了一种基于神经网络模型的智能电网线损估计方法.在BP神经网络算法的基础上采用LM算法对神经网络权重和阈值进行连续优化从而实现网络自适应调节,进而搭建神经网络模型.将模型应用于IEEE33节点系统进行实验,实时估计每条线路的功率损耗并将估计线损值与实际测得的线损值进行比较并提出相应的评估指标对方法有效性进行评估.结果表明,与传统的潮流法相比,所提出的方法具有更优的运算速度和准确度.
为了提升钐铁氮磁体性能,分析了钐含量及合金熔炼、热处理、快淬、热压工艺对钐铁氮材料性能的影响.采用熔炼快淬法制备钐铁合金,通过球磨、氮化得到钐铁氮磁粉,采用热压法得到烧结磁体.采用X射线衍射仪、扫描电子显微镜和振动样品磁强计测量样品结构和磁性能.结果表明:样品中各相含量与熔炼方法、热处理条件具有较强的依赖关系;当热压温度约为290℃时,样品可获得最大形变速率;在625 MPa、500℃条件下样品块体密度为6.65 g/cm3,矫顽力约为800 kA/m,剩磁约为0.59 T.
大汶河流域地表水环境质量对当地经济、环境影响至关重要,通过对“十三五”期间大汶河干流地表水环境监测数据进行分析,运用地表水综合污染指数法进行评价,并用Spearman秩相关系数法检验污染变化可信度,来全面展示大汶河干流地表水环境质量,掌握其污染变化发展趋势,为“十四五”时期水生态环境管理提供有效依据.结果表明,大汶河干流地表水环境质量现状良好,“十三五”末水环境质量达到地表水环境Ⅲ类标准;“十三五”期间各监测点位监测指标超标率明显降低,地表水环境质量稳定好转,其中化学需氧量和五日生化需氧量指标改善较大,水
为了考察K416B合金的组织稳定性及其对合金性能的影响,通过SEM、XRD与TEM等分析手段,研究了1000℃下长期时效对K416B合金的组织转变和1000℃/160 MPa条件下持久性能的影响.结果表明:随着时效时间的增加,K416B合金的γ′相尺寸增加;初生MC型碳化物逐渐转化为M6 C型碳化物,降低了合金的固溶强化作用;合金的持久寿命随时效时间的增加而降低,晶界处的颗粒状M6 C型碳化物数量及尺寸的增加是合金沿晶断裂的主要原因;针状M6 C型碳化物降低了合金的持久寿命,但对合金断裂特征的影响不明显.
大规模工业发展对经济发展具有重要的作用,但经济发展也在一定程度上污染了环境.城市黑臭水体是城市在不断发展中的环境问题,不仅严重影响了环境,而且直接影响城市形象.探讨了城市黑臭水的综合治理技术问题,探讨了黑臭水的长效管理机制,对黑臭水处理技术进行改进与维护,更好地解决黑臭水体的问题,营造良好的城市人居环境.
滚动轴承在旋转机械中应用十分广泛,其运行状态直接影响设备的工作性能,有必要对轴承故障机理进行深入研究.基于Hertz接触理论,建立了四自由度的内外圈复合缺陷球轴承模型,该模型考虑了缺陷引起的时变位移激励和冲击力激励,并分析计算了冲击力的大小及作用角度.分别对内圈、外圈单一缺陷及内外圈复合缺陷情况下球轴承的振动响应进行了数值仿真,仿真结果与实验数据吻合较好,内圈故障特征频率(BPFI)和外圈故障特征频率(BPFO)及其倍频在频谱图中清晰可辨,分析了负载大小和缺陷宽度对轴承振动特性的影响.研究结果可为滚动轴承
目的:探讨血糖和糖化血红蛋白联合监测方式对2型糖尿病患者血糖的控制效果.方法:从我院择选2型糖尿病患者289例,时间线2020年1月—2021年1月,所有患者均采取血糖测定试剂盒(己糖激酶法)和糖化血红蛋白试剂盒(免疫比浊法).比较患者治疗前后的血糖水平与血糖控制指标.结果:治疗前患者的血糖水平高于治疗后,(p<0.05),治疗后患者的的血糖控制指标好于治疗前,(p<0.05).结论:针对2型糖尿病患者,临床血糖测定试剂盒(己糖激酶法),值得推广.