统一数据架构:分析员的“瑞士军刀”

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:qq12441483
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  远有啤酒与尿布的故事,近有给未婚少女发尿片广告被少女父亲投诉后发现真有其事的经典案例,大数据关联分析的价值越来越凸显。
  企业该如何利用大数据获取商业价值呢?Teradata天睿公司大中华区Aster事业部总监孔宇华日前在接受采访时,向记者介绍了更多的应用案例。
  行为路径、防欺诈与关联分析
  一家银行想要通过不同的渠道来了解客户的行为,看客户在注销账户之前,是不是有些可以辨认的行为模式。该银行采用Teradata Aster Data平台,综合网上银行、电话银行、ATM等多种渠道信息进行综合分析,然后给银行的业务人员形成一个可视化的视图,清晰地观察到客户所走的路径,不仅知道客户流失的可能性,同时可以计算出可能流失的时间,这样该银行可以知道在什么时间进行补救更加合适。孔宇华介绍,在银行,除了购买和销户等行为,这样的行为路径分析也用在防欺诈方面。
  美国超市SuperValue利用数据进行产品关联性分析,从而确定超市产品摆放布局、促销的关联产品和购买的关联产品。SuperValue一共有13个集团超市,很早就尝试做关联分析,但过去在一个集团里做一项产品关联分析就需要四个小时,因为时间太长,业务部门都不愿提类似需求。通过选用Teradata Aster Data平台,SuperValue过去只能做到13周的数据关联性分析,现在两分钟就可以实现过去8年的数据的关联分析。
  电子商务企业也非常关心客户行为路径。某电商通过分析客户浏览路径,看客户购买了什么商品,并分析其购买前和购买后的路径。通过路径分析,该电商发现很多客户在购买后会到订单的网页,于是它对客户多次的浏览和购买的行为用Aster做产品关联分析, 然后把与客户所购买产品关联度较高的其他产品放在订单网页上,从而黏住了更多客户,促生了更多购买行为。
  LinkedIn是一家面向商业客户的社交网络(SNS)服务网站,目的是让注册用户维护他们在商业交往中认识并信任的联系人。2008年LinkedIn开发了“people you may know”功能,这是社交网络里面首个开发这种功能——在看到推荐的可能的熟人之后,就可以直接添加,不用自己去找。LinkedIn通过Teradata Aster把用户黏性提高了30%~40%。
  结合SQL与MapReduce
  面对大数据的3V特性(量大、结构多样、实时),目前企业要做大数据分析技术所面临的难度不小。企业虽然过去也在做大量的数据分析,但分析人员大多是用SQL语言实现。SQL是一种高层级语言,易用,写一次可以重复使用。但当所处理的数据量级达到一定程度时,由于在匹配性能等方面的弱势,SQL对数据的处理效率变低。于是很多企业开始寻找大数据平台,MapReduce进入视野。
  MapReduce有较好的编程模式,灵活,扩展性强,可支撑实现真正大容量数据的处理。但MapReduce要求操作人有很好的编程背景,需要编程人员写源代码,很难做到重复利代码,且像连接、分组、排序等SQL具有的一些算法,用MapReduce实现起来会非常慢。
  “于是,我们研发了SQL-MapReduce专利技术,将两个框架结合在一起,实现一个可以重复使用、易用、灵活的,也可以处理大量数据的分析工具。SQL-MapReduce是一个并行的平台,可以处理大容量的数据。” 2008年加入Aster Data的研发团队,有着技术和市场双重背景的孔宇华向记者娓娓道来。2011年Teradata收购Aster时,他正负责Aster的咨询团队、客户服务团队和培训团队。
  孔宇华介绍,近日推出的Teradata Aster大数据综合分析平台整合了Aster和Apache Hadoop,嵌入SQL-MapReduce专利技术,能对新数据源和多结构数据类型进行更深入的分析处理,借助Teradata Aster统一数据架构及SQL-H等高速连接器带来高可扩展性的分析能力。它预先封装了多项开启即用的分析功能,能够快速实现数字营销优化、社交网络分析、欺诈侦测等。
  至于究竟是如何打通SQL与MapReduce的问题,孔宇华如此解说:“Teradata并行数据库注重在操作系统和数据库上的研发和优化,而Aster不仅仅支持并行平台上的数据库,更支持包括MapReduce引擎在内的其他引擎的综合应用。在统一数据架构下,通过SQL-H等高速连接器,Aster对外用SQL交流,对内可做灵活分析。用SQL的时候,是在数据库里运行,而需要用到MapReduce的时候,我们会把数据引导到同一台服务器的MapReduce引擎里面去运行,然后再把输出的数据返回数据库,不需要把数据在不同平台和服务器间迁移,等于给分析人员提供了一把‘瑞士军刀’,他们可以用最合适的工具来完成他们的工作。”
  有了SQL-MapReduce,分析师可以继续用他们熟悉的界面交流,很容易地使用Aster现有和可开发的功能包,结合现有的BI工具,做更多的业务分析。Aster有的功能包已经有50多个,包括路径分析、网路图形分析、文本分析等功能包,可以跨行业应用到各种场景。
  “没有一个有效统一的环境,企业很难及时获取业务洞察。为了满足这种需求, Teradata统一数据架构将多种技术整合到一个紧密结合的、透明的架构中,让用户易于获得和使用这些强大的技术发现大数据中潜藏的价值。”孔宇华说。
其他文献
15年时间可以发生很多事情,但也有事情止步不前。从1996年,Gartner提出BI概念到现在,BI市场上的动静基本都来自于国际厂商,国产BI的声音寥寥。  真正适用于本土的模型从哪来  从总体来看,目前的商业智能发展并不是很成熟,全球如此,在国内就更显突出。国内早期推出的BI类产品只能实现一些简单的功能,只是IT部门对于某些数据的分析,不是真正意义上的BI。随着信息技术的不断进步,企业对信息系统
新年销售季伊始,北京载德科技有限公司便携兔年鸿运之势滚滚而来,日前正式向广大消费者朋友隆重推出其阿帕奇系列最新产品:APH-BH13T,也就是阿帕奇印花系列产品。精美的是外观,出众的是品质,相信通过这一产品的推出,必将为兔年外置便携光驱行业再添一把旺堂火。  阿帕奇印花系列产品秉承了阿帕奇系列产品一貫的商务超薄风格,集超薄便携性于一体,而今又增添了更多的时尚元素。其整体产品厚度不超过17mm,机身
通观钱伯斯的备忘录,似乎只是在列举公司出现的问题,而没有承认是公司的战略失误——虽不“讳疾”,但有些“忌医”的味道。  ——本报记者 姜洪军    “我们使投资者感到失望,使员工感到迷惑。最基本的,我们已经失去了一些信誉,而这是推动思科成功的基础。我们需要挽回这些信誉。”由于思科连续四个季度业绩表现不佳,该公司首席执行官约翰·钱伯斯向员工发布了一份备忘录,承认思科已经丢失了业务重点,在决策过程中也
“快消行业的一个客户采用惠普的混合交付解决方案,包括惠普3PAR云存储产品和传统的存储产品,实现远程容灾,从而将备份时间缩短75%,存储空间的需求量减少50%,存储管理时间减少90%。”中国惠普有限公司企业业务集团存储产品部总经理蔡志刚介绍说,“从对传统IT环境进行改造和优化到帮助用户构建最新的存储基础架构,再到向混合模式的转型,惠普可以为用户提供全面的存储解决方案。”    从CI到融合存储  
2011年5月17日,AMD 公司与北京云基地签署合作备忘录,共同宣布将成立云计算联合实验室。  根据备忘录,AMD与云基地将综合双方优势资源,将建立联合实验室作为长期合作项目,在云服务器、云终端、云应用方案以及基于云应用的平台技术方面开展研究工作。这一合作,标志着AMD在中国云计算时代成功地找到发力点,赶上了中国云计算高速发展的最佳时机。    北京云基地:中国云计算创新样本    对中国IT产
谷歌在稳固了搜索老大地位的同时,采取一系列手段反向切入微软的优势领域。如今,谷歌似乎到了收获的季节,而微软可能因此面临全面的严冬。  ——本报记者 姜洪军    2004年8月,谷歌上市以后,华尔街一度担心谷歌会重蹈网景公司的覆辙,最终被微软靠捆绑手段击败。  在当年的公开场合,谷歌的共同创始人拉里·佩奇多次被问到此问题。佩奇的回答不落窠臼,他没有过多地指责微软的垄断(当时这种思维方式很流行),而
对于A3幅面打印机来说,它们的主要用户是政府、金融、出版等行业用户,这些用户由于经常需要输出比较大幅面的文档,所以对A3幅面的打印机需求很大。对于这些行业用户来说,打印机的速度、质量至关重要。同时,由于输出量很大,他们对产品的使用成本也很敏感。  近日,联想就针对用户的需求,推出了一款高速的A3规格打印机——LJ6350DN。LJ6350DN采用传统的白色外观设计,面板上只有一个取消按键,操作十分
3月30日,曙光公司沿用10多年的品牌标识被封存起来,由“中科曙光”和英文字母“Sugon”组成的新标识正式启用。“更换新标识是曙光公司迈向国际化的第一步。”谈到更换新标识的目的,曙光公司总裁历军表示,“此次启用新标识并非是一次单纯的标识更换,而是曙光公司转型战略深化的需要。”  新标识的启用,对曙光有双重含义:其一,这代表曙光公司已经从硬件提供商开始向服务提供商转型;其二,曙光公司迈向国际化的准
汉王要从一个卖终端的消费电子企业转变成一个卖内容的版权运营平台,确实不易。不过,就冲着刘迎建的为人,股民也该继续支持刘大叔。  —— 专栏作者李易    4月21日14:00,中关村软件园地标性建筑,汉王大厦。刘迎建同志约见大批京城记者,围绕近期汉王股价暴跌、高管套现、利润下滑、一季度财报亏损、前景看淡等一系列争议性话题回应媒体质疑。  个人来看,2011年必将是刘大叔非常煎熬的一年。这种煎熬,甚
IDC、Gartner等权威机构的统计数据显示,早在2001年,美国协同软件的市场份额已占软件整体市场的3%~5%。我国协同软件市场很早就呈现出机遇与挑战并存的局面,其发展前景也一度被看好。2004年底,协同软件市场需求呈现出爆发性增长的态势。  但随着概念炒作日趋严重、协同软件在实际应用中脱离企业需求等问题浮出水面,协同软件未来的发展开始让人担忧。定制化OA的出现,引发了协同软件领域的变革,协同