笔记本电脑BTO生产计划中关联规则挖掘的应用研究

来源 :商场现代化 | 被引量 : 0次 | 上传用户:linjianvhai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要] 本文将数据挖掘技术中的关联规则算法运用于笔记本电脑BTO生产计划中,并基于BTO制造的特点,采用了分类、多最小支持度和增量挖掘的改进算法,挖掘PC配置选择的关联关系,为制造部门制定准确的生产计划提供科学的支持。
  [关键词] 关联规则 多最小支持度 按订单制造 生产计划 笔记本电脑
  
  一、应用背景
  近年来笔记本电脑市场发展迅速,预计2007年全球产量将突破9000万台。为了在满足市场多样化需求的同时又能降低生产成本、提高响应速度,许多企业都在实施一种以销订产、按订单生产(Build to Order, BTO)的模式。BTO模式的成功运行强烈地依赖于原材料供应商、制造企业和销售公司之间的协作关系。然而笔记本电脑制造企业所面对的原材料供应商大多为垄断企业,它们为了自身利益要求按照企业给出的采购预测供货,这样制造企业如何制定一个尽可能准确反映用户个性化需求的生产计划变得尤为重要。但是通常这样的生产计划在现实中仅仅是少数人员根据经验制定,缺乏科学性和准确性。随着数据挖掘技术的不断成熟,在商业领域有着巨大的发展潜力。本文运用其中的关联规则经典算法并结合BTO制造的特点加以改进,挖掘出历史数据库中笔记本电脑配置关联关系,为生产计划提供科学的支持。
  二、关联规则基本概念和描述
  关联规则挖掘是目前数据挖掘领域最活跃的分支之一。一条关联规则是形如 XY 的蕴涵式,其中XY的支持度是事务集中包含X和Y的事务数与所有事务数之比,即Support(XY) =P(XY);它的置信度则是事务集中包含X和Y的事务数与包含X的事务数之比,即Confidence((XY))= P(XY)/P(X);若支持度和置信度分别大于用户定义的最小支持度和最小置信度,则XY为强关联规则。实现关联规则挖掘的算法很多,以下以Apriori算法来描述:
  三、关联规则应用改进
  BTO制造的特殊性和难点在于无法预测到用户的具体需求,业界普遍采用的一种方案是为各机型建立一份备选组件清单,生产计划将转化为对各个组件需求数量的预测。通常,一台笔记本电脑包含了外框体以及若干自选组件,如CPU,RAM,HDD等。与传统的货篮分析相比,BTO笔记本电脑配置信息挖掘又有它不同的特点:
  1.耦合性
  BTO笔记本电脑的订单从内容上看更像是一份电脑组件选购清单,对于大多数组件,不可以重复选择其同类的其他组件。因此,对关联规则算法做如下改进:由频繁K-项集生成侯选K+1项集时,直接忽略同类组件间的关联。对组件进行分类,将所有项目集合I分解为n类: 且有其中表示第n类下的第m种组件。在Apriori_Cgen(Lk)过程中增加限制条件,改进为:
  ,且有
  2.多样差异性
  电脑组件的可替换性、供应商情况和库存成本等因素决定了它们的重要程度各不相同。然而传统关联规则算法仅使用单一的最小支持度,对不同组件重要程度没有区分。因此,采用多支持度关联规则挖掘方法对Apriori算法进行改进。定义各部品的最小支持度为min_sup(in),将候选k-项集中的某一候选项的最小支持度定义为:min_sup(c)= MIN(min_sup(i1), min_sup(i2) ,..., min_sup(ik),其中c={i1, i2, …, ik})。Apriori算法的实现基于以下前提:频繁项的任意子集必是频繁项。但是多支持度关联规则挖掘算法无法满足这一前提。为此,特别规定在1-项频繁项的挖掘过程中对所有的候选项采用所有项支持度的最小值,此后多项频繁项挖掘再采用多支持度的方法,保证算法能够继续适用。
  3.动态性
  企业信息系统每天都在不停地接收来自全球各地的订单,因此采用一种动态更新的关联规则挖掘算法,当数据更新时充分利用原有数据关联规则信息,仅对新增数据进行挖掘,得到新的关联规则结果。本应用将在数据库中记录所有候选项的支持度,无论其最终是否成为频繁项,这样不必重复先前的工作。假设DB为原有的订单记录,db为新增记录。若c在DBdb上频繁,则c至少在DB和db中的一个上频繁。基于以上性质,在db增量数据挖掘时采取以下策略:若c在DBdb上同为频繁项或非频繁项,那么直接定义c在DB和db上频繁或非频繁;若c仅在DB和db中的一个上频繁,则重新计算其支持度进行判定。为此对Apriori_Lgen(Ck)作了补充,比较原有关联规则信息:(1)对增量挖掘中新出现或者丢失的频繁项重新计算其支持度判定频繁属性;(2)对在DB和db中都频繁的项继续判定为频繁项。
  四、应用实例
  我们选取了某笔记本制造企业的一种机型为研究对象,将其组件分为16大类120多项,以下将对其中5类部件关联规则加以跟踪和描述:(1)根据用户提供的包括库存成本,供应商情况等信息对各类电脑组件设定不同的最小支持度(百分比形式),具体为CPU:2%、RAM:10%、LCD:10%、ODD:15%、HDD:8%。 (2)将所有的组件作为候选1-项频繁集,扫描数据库,得到各项支持度如表1所示。根据3.2的改进,此处最小支持度阈值统一采用2%,因此YCPUT135等3项(删除线)被定为非频繁项,而YRAM1520D等8项(带*项)虽然支持度小于本类组件设定的最小支持度,但仍然入选1-项频繁项集。(3)由性质4.1,直接忽略同类组件之间的关联,比如排除{YCPUT225,YCPUT23D}成为2-项候选项,可以减少158次计算。生成2-项频繁项时,采用新的最小支持度计算方法。以{YCPUT23E,YHDDS087}为例该项的最小支持度为2%,计算得到支持度为3.87%,因此入选频繁项集。(4)用同样的方法,得到k-项频繁项集,结果如表2所示:注意频繁2-项集中的{YCPUT23D,YHDDS065},正是由于在1-项频繁项挖掘过程中采用了2%作为支持度阈值使YHDDS065能够入选,否则该2-项频繁项将被丢失。(5)前几步针对该机种某月前2周的3450个订单数据生成了关联规则,在第3周又发生了1473笔新的订单,因此需要更新关联规则信息。在新增数据中发现了新的9组频繁项,如:{YCPUT76D,YRAM162GD},而原关联规则信息中的16组频繁项在新增数据中为非频繁项,如:{YCPUT23D,YHDDS065},因此基于上一次挖掘结果重新计算支持度。以上述两项为例,原记录中SUPDB({YCPUT76D,YRAM162GD})=1.72%新增记录中的支持度为SUPDB({YCPUT76D,YRAM162GD})=4.72%,计算得到新的支持度为SUPDBdb({YCPUT76D, YRAM162GD})=,所以该项成为频繁项,而SUPDBdb({YCPUT23D,YHDDS065})=1.86%,因此从频繁项集中排除。
  通过对订单数据关联规则的挖掘,使用户在制定生产计划时能够充分考虑到这些组件之间的相关性,从一定程度上改变了以往对单个组件孤立地进行预估的状况,使得对各组件产量的计划能够有比较科学的比例关系,更能准确地反映出用户偏好的变化规律,计划更加准确。
  参考文献:
  [1]2006~2007年中国笔记本电脑产业研究报告[R/OL]. http://www.ccidnet.com/
  [2]宫雨:分组多支持度关联规则研究[J].计算机工程与设计,2007,(05):1205~1207
  [3]Cheung D W:Maintenance of discovered association rules in large databases: An incremental updating technique [C]. Proceedings of the 12th International Conference on Data Engineering,1996:106~114
  注:本文中所涉及到的圖表、注解、公式等内容请以PDF格式阅读原文。
其他文献
[摘要] 本文以1999年~2005年黑龙江省R&D投入强度作为原始数据,采用灰预测理论建立数列灰预测GM(1,1)模型,对黑龙江省2006年和2007年的R&D投入强度进行预测并得出了预测结果,黑龙江省2006年的R&D投入强度为0.9963,2007年为1.1121,经检验模型预测精度高达95.38%,拟合度很好。  [关键词] R&D 投入强度 灰预测    一、引言  在知识经济时代,科学
期刊
[摘要] 本文分析了湖南省蓝山县在承接广东珠三角产业转移中毛纺织业崛起的现象,论述了蓝山毛纺织业崛起给湖南省县域经济发展带来的启示。  [关键词] 蓝山 产业转移 县域经济    县域经济是以县为行政区划的区域经济,是国民经济的基础,在国民经济中的地位举足轻重。当前,在西部大开发、东部大开放的背景下,作为中部地区的湖南省如何加快县域经济发展,尽快融入泛珠三角经济圈,是摆在各级各部门的重要课题。而透
期刊
[摘要] 伴随着我国环境问题日趋严峻和全球对于可持续发展的重视增强,FDI在对我国经济发展起到巨大推动作用的同时,其给我国环境所带来的影响也成为了我们所必须予以关注的问题。本文在分析我国目前环境状况和FDI对我国环境影响的基础上,提出了我国实行高环境标准的必要性,并对我国实行高环境标准对FDI带来的影响做出了分析。  [关键词] FDI 环境 高標准    一、目前我国的环境状况  据国家环保总局
期刊
一、当前企业CFO职业素质和能力方面存在的主要问题  随着市场经济的发展,许多企业都设立了CFO。这样以来许多企业的财务工作都有了新的起色。但是,最近以来,有关企业财务造假、财务报表失真的报道屡见报端,究其原因企业CFO的职业素质低下是很重要的一个方面。本人经过对若干企业的研究,认为当前企业CFO职业素质和能力不高的主要原因有如下几点:  1.职业道德的欠缺。主要表现在缺乏敬业精神,对于本职工作相
期刊
[摘要] 本文以陕西省利用国际直接投资的情况为具体研究对象,结合国际直接投资理论及经济增长理论分析了外商直接投资对陕西省经济发展的影响,最后提出了陕西省扩大引资充分利用外资的建议。本文认为,利用外商直接投资在一定程度上弥补了陕西省资金的不足,促进了经济的增长,但同时跨国公司及外商的投资在资本和就业方面存在着的“挤出”效应。  [关键词] 国际直接投资 陕西 经济增长    一、引言  改革开放20
期刊
[摘要] 本文分析了UCP500和UCP600的主要区别,UCP600对信用证结算业务的影响,明确UCP600较旧惯例更加的明确,清晰和精确,更加的易于操作,并提出相关当事人在新惯例下应该注意的问题。  [关键词] 信用证 UCP600 国际贸易惯例    UCP600是国际商会制定的跟单信用证统一惯例(UNIFORM CUSTOMS AND PRACTICE FOR DOCUMENTARY CR
期刊
[摘要] 操作风险是现代商业银行面临的主要风险之一,操作风险同质量管理水平密切相关。6σ管理是现代质量管理的最新成就,对于有效管理操作风险具有重要的意义。本文简要介绍了6σ管理方法,并给出了商业银行操作风险6σ管理的建议。  [关键词] 操作风险 6σ 质量管理    随着金融业市场竞争日趋激烈,银行产品创新不断,业务流程进一步复杂化,经营管理的信息化程度不断提高,风险管理模型日趋复杂,在这些诸多
期刊
[摘要] 郫县农科村作为中国农家乐的发源地,以花卉种植业与乡村旅游业为主要经济载体。在花卉业与旅游业迅速发展的今天,农科村原有的经济模式暴露出很多不足,经济发展速度有所下降。本文在对农科村的经济发展现状进行实地调研的基础上,借用国外的SWOT分析法,对其经济发展的优势、劣势、机遇和威胁进行了具体分析,并提出农科村经济的发展战略。  [关键词] 农科村 经济载体 SWOT分析 发展战略    四川省
期刊
[摘要] 单点登录是跨域分布式计算的一项关键技术并日趋发展成熟,已被广泛应用于当前的企业信息化建设中。使用单点登录技术,用户只需一次登录就可以无缝地访问其授权的所有应用系统,极大地提高了企业员工的工作效率。本文在对Kerberos单点登录模型和SAML单点登录模型分析的基础上,提出了一个综合二者优势的Web单点登录系统模型,并探讨了用户登录和站点跳转的实施过程。  [关键词] 企业信息化 单点登录
期刊
[摘要] 本文从国际竞争力结果的角度,通过计算国际市场占有率、出口增長率、出口显示性比较优势指数(RCA)和贸易竞争力指数(NTB),比较了后ATC时期世界主要纺织品出口国家的纺织品国际竞争力,并对中国纺织品国际竞争力做出了相应的评价,为指导其出口提供了理论依据。  [关键词] ATC 纺织品国际竞争力 RCA NTB    中国纺织品在世界纺织品贸易中一直处于优势地位,是拉动中国外贸增长和稳定就
期刊