大数据之Intel Inside

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:sep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  伴随着“大数据时代已经降临”的宣言,全世界都为大数据而痴狂——大数据除了公认的3V(Volume、Variety、Velocity)特点外,还具备需要做相关性分析、需要实时或准实时流式采集、需要长时间存储的特点。以探讨全球性热点问题或趋势性问题而闻名的达沃斯世界经济论坛,在2012年把大数据作为了一个重要的议题。论坛上,一份题为《大数据,大影响》(Big Data, Big Impact)的报告指出,数据和货币、黄金一样,已经成为一种新的经济资产类别。
  正在英国举办的体育赛事也用上了大数据——世界著名的摩天轮之一“伦敦眼”,依据Twitter上人们评论时所表现出的兴奋度,统计出“积极能量指数”,以此指数控制“伦敦眼”的灯光亮度。
  在大数据时代,数据量排山倒海,形式纷繁,大数据的收集、存储、分析、处理等环节环环相扣。中国的大数据市场有什么特点,能为相关企业提供什么用武之地?推崇“计算就是力量”的英特尔能在大数据领域做出什么贡献,其软硬件综合优化能力如何展现?
  大数据在中国
  英特尔中国区总裁杨叙曾这样调侃中国市场——任何技术,在中国要么没听说过,要么一回过神来,已经上亿人在谈论,甚至在用了。的确,作为典型的新兴国家,中国对新技术和新概念的开放度和接纳度都是极高的,在大数据上也不例外。
  在中国,永远不用担心的是大数据的量——仅以互联网领域为例,中国互联网用户已近6亿。截至2011年年底,中国互联网行业持有的数据总量已达到1.9EB,IDC预计这一数字到2015年将增长到8.2EB以上。
  中国的大数据绝非只是量大。在赛迪顾问软件与信息服务业研究中心研究总监胡晓鹏看来,中国大数据市场在金融、电信、互联网等行业已有少数应用案例出现,但国内企业在大数据领域的理解和实际动作,都还处于初级阶段,产品成熟度不高。用户对于大数据的认识仍然非常模糊,近2年内还属于培育期。随着行业用户对大数据价值的认可程度增加,市场需求将出现爆发式增长,面向大数据市场的新技术、新产品、新服务、新业态会不断涌现。
  赛迪智库软件与信息服务业研究所研究员刘琼认为,随着中国信息化普及程度和应用水平的提升,金融、交通、电信等重点行业和医保、社保、海关等重要领域已经实现或逐步实现了海量业务数据的集中。各个行业和大型企业都在业务发展过程中积累了大量数据,并开始在不同程度上对大规模数据加以利用——银行间实现了金融信息的实时交互和金融服务的多途径提供,民航公司实现了机票的动态分配和全程管理,电信运营商实现了对数以亿计用户和各类增值服务的灵活支持,医保、社保初步实现了对居民医疗信息、保险信息的全面跟踪,海关实现了对所有进出口货物的详尽掌控。可以说,中国在大数据方面已具有了一定的应用基础。
  对于中国大数据市场,很多厂商都有自己的理解。英特尔认为中国将成为全球重要的大数据市场之一。中国政府对物联网、云计算的重视会有力推进大数据在中国的落地和应用。随着云计算、物联网、移动互联网、社交网络等新技术和应用的兴起,大数据伴随这些应用不断增长,大数据中蕴含的巨大价值,带来对数据快速处理和分析的迫切需求,将引发数据挖掘、商业智能市场的空前繁荣。
  大数据的硬性依托
  新的科技爆发点意味着新的机会。大数据给IT领域的厂商带来了新的增长点。大数据的获益方涵盖了IT业界的整个产业链:软件公司利用适合大数据的新平台和新工具开发出多种应用;业务公司面临着大量大数据分析和业务优化的需求;无论是服务器还是存储,大数据都对硬件公司有了更高的性能要求和更多的采购需求。
  在IDC对大数据的十大预测中,有一条与硬件厂商息息相关:大数据会显著推动基础架构横向扩展。大数据的存储和处理都需要采用分布式的方式,适合采用多节点和多核的架构。刘琼指出,大数据要求CPU的指令集更适合非结构化、半结构化数据的处理,内存速度更快,内存或主板的逻辑结构更适合进行内存计算等高速计算以及更强烈浸入感的显示设备。这些都在强调传统硬件厂商的重要性。英特尔就明确表示:“只有硬件平台发展到一定程度,才能提供对大数据进行存储、分析、价值挖掘的可能性。”
  英特尔中国行业合作与解决方案部中国区总监凌琦谈到,大数据的分析和处理,需要大规模的数据中心,需要可扩展性的数据存储结构,需要高性能的数据分析处理器,这正是英特尔作为“计算能力提供商”的优势所在。
  CAP定理指出了“一个分布式系统不可能满足数据一致性、系统高可用性和容忍网络隔离这三个需求,最多只能同时满足两个”的残酷现实。在大数据领域,容忍网络隔离是必须的,这就意味着系统横向扩展性必须增强。
  要实现大数据存储和处理基础架构的横向扩展,就不得不提x86架构的天然横向可扩展性。英特尔在计算领域的成功经验可以在存储领域沿用——英特尔一直推进数据中心标准化和开放云计算平台,并已经初步形成了基于开放架构的云计算产业创新体系。此外, x86节点提供了较高的计算密度、较低的成本和功耗。以及简单灵活的管理。因此,基于x86平台的集群存储在大规模存储大数据时具备不可比拟的成本优势。
  处理器性能是根本。英特尔至强处理器为大数据的分析、处理提供源动力。数据的读取速度是瓶颈。英特尔数据直接 I/O 技术(DDIO)可显著提升平台总体 I/O 性能。存储的成本限制了数据的规模。英特尔 SATA接口的固态硬盘(SSD)为原始存储提供高性能、高吞吐率的支持。
  提供足够的传输带宽和减少传输延迟则是信息流动的前提。英特尔万兆位以太网高速、低延迟特性使得替代光纤网络通道(FcoE)和以太网小型计算机系统接口(iSCSI)构建数据中心统一网络成为可能。此外,英特尔将安全性内嵌于硬件中,可有效保护分布式基础设施并加快数据加密速度,有效提高性能并加强数据保护。
  Intel Hadoop行动
  大数据离不开Hadoop。Hadoop是继Linux之后的又一热点开源软件,它成功解决了大数据分布式存储、并发式访问等问题。Facebook和eBay等互联网公司都在使用Hadoop软件分析大量的数据,IBM、微软、甲骨文等都推出了基于Hadoop的大数据处理工具。英特尔自然不会落后。针对中国市场,英特尔推出Hadoop发行版,满足具有代表性的中国客户和市场需求,然后在全球范围内推广。   胡小鹏和刘琼都认为,大数据涉及到采集、存储、读写、运算、分析等多个环节,对每个环节的专业性要求都很高。另外,用户更关心大数据分析的结果,而对大数据处理的过程关注度并不高,用户希望能够快速部署大数据处理分析环境,所以用户对大数据整体解决方案的需求巨大。因此,大数据领域的软硬件集成显得重要。通过软硬集成的整体方案,可以使软硬件性能得到更好的优化,保证存储、服务器以及数据分析软件之间的兼容性、一致性和可扩展性,从而保障用户的数据安全与数据分析效率。
  Hadoop的开源特性,决定了每家有志于大数据领域的企业都可以在其上发挥所长。作为一个对硬件有着深刻理解力的企业,英特尔的软硬件综合优化能力自有独到之处。Intel Hadoop Manager就充分体现了这种能力。
  在HDFS(分布式文件系统)中,Intel版本独有高级均衡算法,可提高系统扩展性,适合不同配置服务器组成的集群。在HBase分布式数据库中,Intel版本可根据位置和表数量智能地进行负载均衡,获得更高的读写性能。Intel版本独创了跨数据中心大表让多个分中心可以位于不同地理位置,而接入任何一个分中心可访问全局数据,这就是分布式聚合计算。
  英特尔对Hadoop性能的优化可以用测试结果来证明——在由6台服务器(配置为E5-2680 8核CPU、64GB内存、8块7200rpm SATA硬盘)组成的小规模集群上,每秒查询次数开源HBase是700次,优化HDFS I/O是3500次;开源HBase每秒插入数据25000条,经过区域平衡后,每秒可插入数据82000条。以HBase作为数据存储,每秒每个服务器平均可插入10000条大小为1KB的记录,读盘时以小于1秒的延时进行每秒每服务器多余400次的查询。
  英特尔亚太研发有限公司总经理、软件与服务事业部中国区总经理何京翔强调,以基于至强处理器构建的高效IT基础设施为基石,英特尔计划在其上的数据组织与管理层,针对大数据的分发和管理需求提供针对英特尔平台优化的Hadoop产品和服务;在分析与发现层,提供针对客户端与服务器端算法开发的支持;在决策支持与IT服务层,联合生态系统内的合作伙伴,提供更为优化的可视化应用体验。
  值得一提的是,5月30日,英特尔宣布在美国麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)建立大数据科学技术中心(ISTC),力求加速科学与医药发明、企业与行业计算,并着重推动在新的数据密集型应用领域的最终用户体验的设计创新,发掘出新的共享、存储和操作大数据的计算解决方案。
其他文献
BPM,业务流程管理一直是一道难题。如果没有正确的方法和工具以及坚定的执行力,BPM很容易流于形式,成为闹剧。近年来,众多企业都在摸索自己的BPM之路。近日,在京举行的2012 ProcessForum业务与IT管理者盛会暨Software AG中国区卓越业务流程管理年会上,以太平共享金融服务(上海)有限公司(以下简称太平共享)为代表的多家企业分享了他们的BPM经验。  服务与流程关系的困惑  太
在国内的安全市场上,存在着企业盲目跟风、同质化产品恶性竞争等问题,使安全厂商整体技术水平提升有限。  ——本报记者 高春燕  今年5月,国务院常务会议讨论通过了《关于大力推进信息化发展和切实保障信息安全的若干意见》,明确指出要“强化技术防范,严格安全管理,切实提高防攻击、防篡改、防病毒、防瘫痪、防窃密能力”,“加大信息安全技术研发力度,支持信息安全产业发展”。  如今,以互联网为代表的信息技术已全
2012年度中国  物联网产业  领军人物奖  陈勇,江苏物泰信息科技有限公司首席执行官、执行董事。陈勇在云计算的平台和应用的研发、运营、市场推广、引进风险投资和规划海外上市等方面有丰富经验。  陈勇,江苏物泰信息科技有限公司首席执行官、执行董事,2006中国十大新媒体人物,中关村留学生创意产业园创业导师,石景山区海外联谊会理事。他是吉林大学计算数学学士、美国佛罗里达州立大学计算机硕士和博士(信息
2012年度中国  公积金行业信息化  最佳解决方案  依托多年来在银行和公积金行业的技术积累和服务经验,华信永道旨在为全国住房公积金行业、银行业客户提供完整的信息系统解决方案,包括业务与应用咨询、应用系统的开发与服务、系统软硬件的集成服务、安全体系咨询与建设。  华信永道(北京)科技有限公司(以下简称华信永道)是大连华信计算机技术股份有限公司旗下专注于提供住房公积金行业和银行业信息化解决方案的子
继微软换标之后,近日视频通信厂商Polycom(宝利通)也更换了其沿用22年之久的标识。对于IT市场中的成熟品牌而言,更换品牌标识无疑是一次颇具风险的押注。向来以稳健著称的Polycom,又为何会做出如此重大的改革呢?  转型应用方案商  “换标识主要是从市场的应用,以及未来发展策略着手进行的。新标识展示了Polycom的最新精神和策略。在中国,我们对新标识的诠释是创新、协作和共赢。”Polyco
如今,许多软件开发人员已经可以使用自动化测试、持续集成、测试驱动开发、看板管理、用户故事等方式,使得软件的开发过程变得更加灵活,工作效率得到大幅提升,软件质量能够得到很好的保证。在这种情况下,很多软件交付团队还要特别注意以下三个问题:是否选择了一个正确的产品开发方向,并有一个良好的开端;能否在软件交付过程中,让交付团队共同分享正确的上下文;能否在软件上线之后获得用户真实的反馈,并不断改善设计。  
2011年是伊顿公司的百年华诞。在台北市举行的2011年伊顿北亚区经销商大会上,200多位来自伊顿北亚区各国的经销商喜气洋洋。伊顿电气集团电能质量业务北亚区总裁蔡嘉明告诉记者,许多经销商跟随伊顿已经有10~15年,最长的超过30年。伊顿的魅力何在,能让经销商有如此高的忠诚度,又是什么让伊顿百年不衰?    渠道:变则通    蔡嘉明介绍说:“伊顿80%的产品都是通过渠道销售的。伊顿未来会更加依靠渠
全球最大的中文搜索引擎——百度一直被认为是一家与谷歌相类似的公司。过去一年,百度在国内互联网搜索市场占据的份额超过了70%,遥遥领先于其他搜索引擎公司。不过,百度似乎并不甘心仅仅在搜索市场称王称霸,下一步,它很可能大举进军国内电子商务市场,而首当其冲的竞争对手就是马云的阿里巴巴。  2010年5月10日,阿里巴巴旗下的淘宝与软银集团合作,淘宝的中国卖家将可以在雅虎日本的网站上销售商品。此次借雅虎进
《中国计算机报》作为一家IT专业媒体,该如何体现价值?答案应该是通过专业的视角和内容来提升传播质量,通过专业的营销手段降低目标受众获取信息的成本。    当前的中国媒体正在经历一个崭新的变革。以文字、声音和图像来分类的媒体界限已变得模糊,以纸质、网络、电视、手机等形态来评判媒体的影响力已显得肤浅。在这样的背景下,《中国计算机报》作为一家IT专业媒体,该如何体现价值?答案应该是通过专业的视角和内容来
2012年度中国  档案云计算  应用创新奖  2012年度中国  行业信息化  移动办公最佳企业奖  2012年度中国  行业信息化  值得信赖品牌奖  美络公司是知名的协同办公及档案软件与内容管理服务供应商,是专门从事电子政务软件开发和系统集成的高科技企业,旗下拥有知名的档案软件品牌飞狐灵通。  北京美络克思科技有限公司(简称美络公司)成立于1999年,是知名的协同办公及档案软件与内容管理服务