论文部分内容阅读
摘 要:本文系统的探讨和分析了大数据及统计分析方法在烟草行业的应用和发展,基于不同的研究目的挖掘出潜在有价值的信息,详细列举了其在物流、烟叶质量评价方面的应用,并对统计方法选择、其应用前景和目前的一些问题进行分析和探讨,为推动烟草行业的发展,提高行业竞争力奠定了基础。
关键词:大数据;统计分析;数据挖掘;烟草
目前大数据技术在医疗、信息、交通、教育等行业中已经发挥出了巨大的潜力和优势,而处于信息转型升级中的烟草行业也非常重视大数据、云计算等信息新技术在行业信息化发展中的应用。充分利用信息和统计计算技术进行市场预判、决策制定调整对一个行业持久不息的成长结合发展至关重要。而烟草行业在转型升级中也非常重视大数据、云计算等信息新技术的发展应用。通过数据分析软件和算法,对与烟草有关的大数据进行整合和处理,并结合社会经济因素,对其背后的现象进行分析,可以更好地预测事物发展的趋势。
1 大数据下烟草行业的统计分析应用
随着网络和信息化建设的发展,我国绝大部分烟草公司都有自己的电子信息数据库,即所谓的烟草进销存系统。其中包含着多年以来烟草企业积累的大量的客户资料和订单数据等信息。结合统计分析和数据挖掘技术对这些己有的、大量的客户订单数据进行分析,可以制定有效的营销措施,对烟草的生产和销售提供决策支持。
1.1在物流管理和配送中的应用
经济水平的提高,交通设施的普及和快速发展,加速了人们之间的相互交流和人群流动,而物流行业的快速发展,给人们提供了更多的选择性。因此越来越多的学者关注大数据下对烟草物流服务的智能管理。加强对烟草领域物流行业的管理,可以优化物流流程、提高物流效率、降低物流成本。除了加强物流配送的管理基础外,优化建设区域性的物流配送集散中心相当重要。
很多企业已经实现了智能物流的建设,通过对智能仓储的应用,充分利用仓库内实时收集的各类数据,只能优化库区安排和货位分配,节约了人工成本提高了仓储效率。最重要的则是利用大数据跟GIS分析方法结合优化配送模式。首先可以基于Location-Allocation模型(区位配置模型)选择合适的仓库位置或设置合理配送点,收集零售客戶的位置信息,并结合送货车辆的实时GPS信息,实现最快最优的区域配送。这样便可以获取用户的位置信息,烟草商业公司拥有前期采集的大量行驶数据、所有零售户的订单信息、地理位置信息、车辆配载情况、现有可调度运力资源、车辆行驶路线、库容、存销比、每日的到货情况等相关数据信息,可通过数据分析大幅提高物流水平。
(1)各区域需求强度分析。基于地理信息和需求数据,可以先简单统计分析出需求量最大的区域,制作出城市烟草物流配送热力图,随后可以进一步利用核密度分析或者聚类方法在地理上寻找出物流配送的热点区域,并结合该区经济发展,人口密度等信息建立区域用户需求和当地社会经济条件的关系,从而寻找出其他有较大需求的地区,进一步考虑物流配送的强度。
(2)配送路径管理。我国现在的卷烟物流配送实行地区统一配送,客户数量庞大,每个环节都会产生巨大的数据流。因此在现有资源的基础上如何合理调配车辆和线路,从而在降低成本的同时又能满足客户的需求,成为烟草行业面临的重要问题。配送线路优化是提高烟草配送服务质量和降低配送成本的重要手段。烟草配送在整个烟草物流管理中占有重要的部分,将遗传算法等数据挖掘技术运用到烟草配送中解决运输线路选择等问题,可以有效利用现有资源和提高运输效率。
1.2烟叶感官质量评价
烟叶是卷烟工业的物质基础,烟叶质量决定着卷烟企业的持续经营能力和市场竞争能力。传统的卷烟感官质量评价方法主要是采用人工评吸评价方法,该方法对评吸人员有较高要求,存在较大的主观性。目前,在广泛的烟叶和烟气分析数据的积累下,人们已经能够运用回归分析或方差分析等统计分析方法来寻找化学成分和卷烟质量的关系,从而实现从主观经验测评到依靠化学成分评价卷烟质量的过渡。随着智能算法和数据挖掘技术的发展,学者们开始在以前的基础上选择自适应强、受样本噪声影响小、适合大样本集分析的方法进一步建立卷烟感官质量模型。邵惠芳等基于企业对烤烟质量综合评价的需要,首先运用相关分析和方差分析方法筛选出主要化学成分或指标作为考察因子,然后采用自组织特征映射神经网络(SOFM)对烤烟常规化学成分和感官质量(香气质、香气量、劲头、浓度、余味、杂气、刺激性)进行聚类,最后借助于雷达图对烤烟感官质量和主要化学成分之间的关系进行聚类模式分析,得出了烤烟还原糖含量与主要挥发性香气物质及各感官质量指标之间的关系,为卷烟原料体系构建和卷烟配方提供了参考。
2 结果与讨论
大数据下的统计分析方法除了传统经典的统计分析方法,如能直观分析和判读数据的多元作图可视化、把数据化繁为简的主成分分析、将数据分门别类的聚类分析、诊断识别新样品的判别分析及解析两组变量之间关联的典型相关分析外,还包括由数据挖掘算法出现带来的一系列如时间序列分析、神经网络、遗传算法、分类与回归树、偏最小二乘、支持向量机等新型方法。
大数据的统计分析方法层出不穷,本文仅是列举了一部分方法在烟草行业的应用,事实上目前在烟草行业实际应用实例还是太少,且很多都是对数据表层的分析,将数据与地理环境、社会经济因素等联系起来研究滋生该现象分布的背后机理的研究很少。简单的统计分布图表只能获取趋势变化,无法分析烟草行业在时间的演化和空间上分布,从而研究其时空动态规律。跨学科的结合将会给烟草行业统计分析工作提供更多信息,比如跟地理信息结合,发展烟草地理,利用GIS技术实现烟草分布地图制图,热点展示等,必然将烟草行业的数据分析工作推进新的高度,为提高烟草行业竞争力提供有力的保障。
关键词:大数据;统计分析;数据挖掘;烟草
目前大数据技术在医疗、信息、交通、教育等行业中已经发挥出了巨大的潜力和优势,而处于信息转型升级中的烟草行业也非常重视大数据、云计算等信息新技术在行业信息化发展中的应用。充分利用信息和统计计算技术进行市场预判、决策制定调整对一个行业持久不息的成长结合发展至关重要。而烟草行业在转型升级中也非常重视大数据、云计算等信息新技术的发展应用。通过数据分析软件和算法,对与烟草有关的大数据进行整合和处理,并结合社会经济因素,对其背后的现象进行分析,可以更好地预测事物发展的趋势。
1 大数据下烟草行业的统计分析应用
随着网络和信息化建设的发展,我国绝大部分烟草公司都有自己的电子信息数据库,即所谓的烟草进销存系统。其中包含着多年以来烟草企业积累的大量的客户资料和订单数据等信息。结合统计分析和数据挖掘技术对这些己有的、大量的客户订单数据进行分析,可以制定有效的营销措施,对烟草的生产和销售提供决策支持。
1.1在物流管理和配送中的应用
经济水平的提高,交通设施的普及和快速发展,加速了人们之间的相互交流和人群流动,而物流行业的快速发展,给人们提供了更多的选择性。因此越来越多的学者关注大数据下对烟草物流服务的智能管理。加强对烟草领域物流行业的管理,可以优化物流流程、提高物流效率、降低物流成本。除了加强物流配送的管理基础外,优化建设区域性的物流配送集散中心相当重要。
很多企业已经实现了智能物流的建设,通过对智能仓储的应用,充分利用仓库内实时收集的各类数据,只能优化库区安排和货位分配,节约了人工成本提高了仓储效率。最重要的则是利用大数据跟GIS分析方法结合优化配送模式。首先可以基于Location-Allocation模型(区位配置模型)选择合适的仓库位置或设置合理配送点,收集零售客戶的位置信息,并结合送货车辆的实时GPS信息,实现最快最优的区域配送。这样便可以获取用户的位置信息,烟草商业公司拥有前期采集的大量行驶数据、所有零售户的订单信息、地理位置信息、车辆配载情况、现有可调度运力资源、车辆行驶路线、库容、存销比、每日的到货情况等相关数据信息,可通过数据分析大幅提高物流水平。
(1)各区域需求强度分析。基于地理信息和需求数据,可以先简单统计分析出需求量最大的区域,制作出城市烟草物流配送热力图,随后可以进一步利用核密度分析或者聚类方法在地理上寻找出物流配送的热点区域,并结合该区经济发展,人口密度等信息建立区域用户需求和当地社会经济条件的关系,从而寻找出其他有较大需求的地区,进一步考虑物流配送的强度。
(2)配送路径管理。我国现在的卷烟物流配送实行地区统一配送,客户数量庞大,每个环节都会产生巨大的数据流。因此在现有资源的基础上如何合理调配车辆和线路,从而在降低成本的同时又能满足客户的需求,成为烟草行业面临的重要问题。配送线路优化是提高烟草配送服务质量和降低配送成本的重要手段。烟草配送在整个烟草物流管理中占有重要的部分,将遗传算法等数据挖掘技术运用到烟草配送中解决运输线路选择等问题,可以有效利用现有资源和提高运输效率。
1.2烟叶感官质量评价
烟叶是卷烟工业的物质基础,烟叶质量决定着卷烟企业的持续经营能力和市场竞争能力。传统的卷烟感官质量评价方法主要是采用人工评吸评价方法,该方法对评吸人员有较高要求,存在较大的主观性。目前,在广泛的烟叶和烟气分析数据的积累下,人们已经能够运用回归分析或方差分析等统计分析方法来寻找化学成分和卷烟质量的关系,从而实现从主观经验测评到依靠化学成分评价卷烟质量的过渡。随着智能算法和数据挖掘技术的发展,学者们开始在以前的基础上选择自适应强、受样本噪声影响小、适合大样本集分析的方法进一步建立卷烟感官质量模型。邵惠芳等基于企业对烤烟质量综合评价的需要,首先运用相关分析和方差分析方法筛选出主要化学成分或指标作为考察因子,然后采用自组织特征映射神经网络(SOFM)对烤烟常规化学成分和感官质量(香气质、香气量、劲头、浓度、余味、杂气、刺激性)进行聚类,最后借助于雷达图对烤烟感官质量和主要化学成分之间的关系进行聚类模式分析,得出了烤烟还原糖含量与主要挥发性香气物质及各感官质量指标之间的关系,为卷烟原料体系构建和卷烟配方提供了参考。
2 结果与讨论
大数据下的统计分析方法除了传统经典的统计分析方法,如能直观分析和判读数据的多元作图可视化、把数据化繁为简的主成分分析、将数据分门别类的聚类分析、诊断识别新样品的判别分析及解析两组变量之间关联的典型相关分析外,还包括由数据挖掘算法出现带来的一系列如时间序列分析、神经网络、遗传算法、分类与回归树、偏最小二乘、支持向量机等新型方法。
大数据的统计分析方法层出不穷,本文仅是列举了一部分方法在烟草行业的应用,事实上目前在烟草行业实际应用实例还是太少,且很多都是对数据表层的分析,将数据与地理环境、社会经济因素等联系起来研究滋生该现象分布的背后机理的研究很少。简单的统计分布图表只能获取趋势变化,无法分析烟草行业在时间的演化和空间上分布,从而研究其时空动态规律。跨学科的结合将会给烟草行业统计分析工作提供更多信息,比如跟地理信息结合,发展烟草地理,利用GIS技术实现烟草分布地图制图,热点展示等,必然将烟草行业的数据分析工作推进新的高度,为提高烟草行业竞争力提供有力的保障。