迎接大数据浪潮

来源 :科学中国人 | 被引量 : 0次 | 上传用户:slyde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  一、大数据将是信息技术领域的下一波浪潮
  继第二代互联网(Web2.0)和云计算之后,大数据接踵而至,有可能成为信息技术界的下一个重大热点。第二代互联网将人和物实现联网,云计算是向在线计算基础设施转变,大数据则通过对传统计算技术无法分析的大量数字信息进行存储和处理来创造价值。据美国思科公司估计,到2015年全球互联网流量将达到4.8ZB,这表明大数据面临的挑战和机遇近在眼前。
  全球计算机产生的数据量呈几何级数增长,有种种原因。首先,由于电子商务和积分卡计划,零售商开始建立庞大的数据库,记录客户活动。物流、金融服务、医疗保健和许多其他行业中的组织也正在收集越来越多的数据,希望从中获得附加值。社交媒体创造了大量的数字资料,从中有可能会挖掘出有价值的信息。此外,由于视觉识别技术的提高,计算机从静止图像和视频中收集有用信息和数据关系,开始成为可能。随着越来越多的智能对象联网,不断扩大的物联网也在产生大规模的数据。最后,快速基因组测序技术、纳米技术、合成生物学和气候模拟等领域的科技进步正开始产生并依赖大量的数据,其数据量之大,直到最近还几乎是无法想象的。
  收集和存储大数据,并从中创造价值,引起了许多技术上和概念上的挑战,超出了传统的计算能力。
  数据量大既是大数据的最大挑战,也是其最大的机遇。这是因为,大量数字信息的存储、相互关联和处理为广泛的活动提供了巨大的可能性,包括客户行为预测、疾病诊断、医疗保健服务计划制订和气候建模。然而,传统的计算解决方案越来越难以胜任此类任务。
  大数据的速度也引发了一些重要问题。首先,大多数组织的数据流入速度正日益超出其信息技术系统的存储和处理能力。此外,用户越来越希望向他们实时传递流媒体数据,并且是传输到移动设备上。在线视频、定位、增强现实技术和许多其他应用现在依赖大量的高速数据流。对许多公司来说,传输高速数据流是相当大的挑战。
  大数据的另一个突出特点是数据类型多样。数据中心只需要处理文档、金融交易、股票记录、人事档案的日子一去不复返。今天,图片、音频、视频、三维模型、复杂的模拟和定位数据被存入大量的企业数据仓库。这些大数据源中,许多几乎完全是非结构化的,因而不易分类,更不用说用传统的计算技术去处理。这一切意味着,大数据实际上是凌乱的数据,在开展任何有意义的分析之前,需要下大力气进行复杂的预处理和数据清理。
  由于上述挑战,许多组织别无选择,只能忽略或快速排出大量可能非常有价值的信息。它们收集的很大一部分数据都未经处理,并且大量有价值的数据像废气一般被排出去。例如,目前医院在手术治疗过程中拍摄的几乎所有视频数据在几周内删除。然而,对这些图像流进行智能挖掘,既可改善个体患者的治疗效果,也可改进更广泛的医疗保健计划。
  二、大数据需要新的技术解决方案
  由于其数量、速度和类型提出的种种问题,大数据需要新的技术解决方案。目前名为Hadoop的Apache开源项目在这一领域处于领先地位。它提供了首个可行的大数据分析平台。大数据领域的绝大多数开拓者已经在使用Hadoop系统。例如,LinkedIn公司是一家面向商业客户的社交网络服务网站,目前使用Hadoop系统每周产生超过1000亿条个性化建议。
  目前,除了原有的信息技术系统,许多大数据业务的开拓者在部署Hadoop系统,以便让这些系统把新老数据结合起来。然而,随着时间的推移,Hadoop系统可能注定要取代许多传统的数据仓库和关系型数据库技术,成为处理多种数据的主导平台。
  许多组织不可能有足够的资源和专业知识去实施自己的Hadoop解决方案。幸运的是,它们不必这样做,因为已经可以利用云计算解决方案。亚马逊、谷歌和网域存储公司(NetApp)等供应商提供云计算解决方案,能够让各种规模的组织开始受益于大数据处理的潜能。利用云计算处理大量的公共数据也会起到很好的效果。例如,亚马逊公司已经存储了许多公共数据集,包括美国和日本的人口普查数据,以及基因组学和其他医学与科学的许多大数据存储库。
  展望未来,随着人工智能的进步和新型计算机处理能力变得可用,大数据将突飞猛进。例如,未来量子计算很可能极大地提高大数据的处理能力。
  三、驾驭大数据将具有深远意义
  尽管挖掘TB级、PB级甚至EB级的数据在技术上具有挑战性,但却提供了重大机遇。事实上,无需多年,大数据技术和方法很可能让几乎每一条以往存储的数字信息产生某种额外的、派生的价值。正如IBM公司解释的那样,“大数据是一个机会,可以在新型数据中寻找新的见地,可以使业务更加敏捷,并可以回答以前回答不了的问题”。
  更具体地说,大数据可以提高分析的洞察力,可以创造以前不可能有的新产品和新服务。谷歌、亚马逊和脸谱(Facebook)等业界先锋已经以实例证明,大数据如何能够提供高度个性化的搜索结果、广告和产品建议。随着时间的推移,大数据还有可能帮助农民准确地预测恶劣天气和作物歉收。政府则有可能使用大数据来预测社会动乱或传染病,并制定应对计划。
  认识到大数据的潜力,2012年3月,美国政府宣布向大数据项目投入2亿美元,以极大地改善所需技术和工具,实现海量数据的存取和组织,并取得发现。白宫科技政策办公室甚至将此称为自互联网兴起以来最重要的公共技术投资之一,其主要目标是“加快科学和工程探索的步伐”。
  正如美国网域存储公司NetApp解释的那样,从根本上来说,大数据的发展涉及创造新的信息技术系统,这种系统不是仅用于存储数据的仓库,更是一些紧密关联的系统。长久以来,我们已经习惯于将数据输入计算机系统,取得相对较少的回报。但是,通过对越来越多的大数据集进行合并分析,我们可能从计算机系统中获得更多的回报。
  例如,通过利用大数据技术对每天12000GB的推文(用户在社交网站Twitter上发表的消息)开展实时情感分析,以了解全世界对事物的看法,已经成为可能。但这仅是开始,因为大数据可提供各种可能性,可能会增加和完善各类组织为客户提供的服务。
  麦肯锡全球研究院在最近的一份大数据报告中估计,通过利用大数据,美国医疗保健行业可提高效率和质量,能每年节约3000亿美元,使医疗保健支出削减8%左右。据其估计,在整个欧洲,利用大数据每年至少可节约1490亿欧元的政府行政成本。从更广泛的意义上说,制造业企业将大数据贯穿整个研发、工程设计和生产过程,可能会显著减少产品上市时间,并提高产品质量。
  大数据无疑会产生形形色色的具有数据跟踪能力的组织,令人畏惧,但是大数据的积极影响很可能大于其负面影响。例如,大数据可能会提高城市的交通管理,并可能实现更智能地运行电力基础设施,从而促进可持续发展。
  实际上,通过利用大数据,我们可以开始按照人们的真正需求,实现资源的分配和世界的运转,而不是盲目地猜测人们的未来需求。换言之,对人类活动的认识越深,我们就越不需要生产人们实际上并不需要的产品,并把它们运至零售网点。
  (作者:刘润生,中国科学技术信息研究所助理研究员,科技参考研究室负责人,主要从事科技战略与政策研究。)
其他文献
少年邹德慈:  踏实铺路 “功夫在平时”  1934年,上海。邹德慈出生在一个知识分子家庭。他的祖父给他起了“德慈”这么一个富含深厚底蕴的名字,希望他能德慈兼备。  生在旧社会,长在旧社会。战火纷飞的年代,其中经历的艰辛磨难自不必细说。邹德慈十岁那年父亲去世。是他的母亲,一个坚强、知性的女人,靠着担任小学英文教师不高的收入,在动乱时代独立支撑起这个家,只希望他们兄妹俩能够顺利长大成人,用功读书。 
“一条大河波浪宽,风吹稻花香两岸。”半个世纪前,一曲《我的祖国》唱得回旋婉转,荡气回肠。这条“大河”就是流域面积27万平方公里、流域人口1.7亿的中国第三大河——淮河。在中华腹地上,它默默流淌了上百万年,甘甜清冽的河水滋养了两岸祖祖辈辈的居民。  然而,到了上世纪90年代,曾有人问及居住在淮河边的孩子:“水是什么颜色?”答曰:“黑色。”这时的淮河,劣V类水比重超过50%。所谓劣V类水,即是“不可饮
Jos Lelieveld等人发现,户外空气污染主要由细颗粒物造成,在世界范围内每年导致大约300万人早死。来自住宅能源使用如取暖和做饭(在印度和中国普遍存在)的污染物排放在全球范围内对早死有最大影响。在美国大部分地区和少数其他国家,来自交通和发电的污染物排放是重要因素,而在美国东部、欧洲、俄罗斯和东亚,来自农业生产的污染物排放对细颗粒物的相对贡献最大,对健康的总体影响取决于有关毒性的假设。
对“救死扶伤”的认识,大多数人都停留在工作在前线的稳重、温文尔雅的医生和美丽、端庄大方的白衣天使,很少有人关注到从事医学超声工程研究的工作者们。其实,工欲善其事必先利其器,要检查出日益隐蔽和复杂的病情病因,医生们少不了要借助于高端先进的超声仪器的帮助。而借助于各种超声探头,医生们就如同长了一双双“慧眼”,能敏锐洞察患者脏器内的细微病变,不放过任何蛛丝马迹。准确的超声诊断,能让临床治疗“有的放矢”。
创新研发是医药产业永恒的主题。对医药产业而言,无论是研发原创的新药,还是仿制其他专利到期的药品,都需要不断革新。“我们希望创新的好药可以惠及更多患者,也为企业带来收益,实现社会、企业和患者的多赢。”呼吁推动医药产业创新发展的声音不绝于耳。“十二五”期间,我国在重大新药创制投入400亿~500亿人民币,为医药企业创新提供了平台。丽珠医药集团股份有限公司成立于1985年1月。30年栉风沐雨,30年风雨
21世纪是一个讲究幸福指数的时代,健康更是应有之义。随着社会的进步,人们的物质生活水平大幅提升,快速发展的医疗手段极大地保障了人们的生理健康。但与之相对的是,心理健康水平并没有随着生活水平一起提高,已经成为了人们身心健康的短板。这就使得心理健康研究被摆在了空前重要的位置上。  经过多年的发展,我国已经形成了完整的身心健康教学、科研和社会服务体系,北京师范大学心理学部便是其中的佼佼者。时任心理学部副
2015年3月18日,素有“女性诺贝尔奖”之称的第十七届欧莱雅—联合国教科文组织“世界杰出女科学家成就奖”颁奖典礼在巴黎索邦大学举行。来自世界五大洲的五位女性科学家获得了该项荣誉,每一位获奖的女性凭借在基础科学领域的突破性研究,不断扩展人类对世界的认知,通过解决最基本的宇宙问题积极应对当今人类社会所面临的一系列挑战,她们是追求科学的卓越典范,她们向世界证明了女性同样可以为科学发展做出巨大贡献。她们
Nature  最强镁合金  Nature封面:利用透射电子显微镜捕捉到的超强镁合金薄膜的微观结构。Nature杂志第7652期封面文章报道了高强度的镁合金材料。这种合金由双相纳米结构造就,强度接近理论极限。纳米构筑晶态金属合金能得到高强度的材料,但随着应变的增强,这种材料往往会软化。吕坚及其研究团队将纳米晶体与单相非晶态金属玻璃的优势结合起来,制备出了一种双相材料——二铜化镁纳米晶粒(直径6nm
写在前面  初到西北,我膜拜的是这一片堆积历史文明的皇天后土,感叹于这神奇土地上文化积淀之厚重;而今,我膜拜的还有这里的一群人,感叹于他们追求科学的献身精神。这批生活在祖国西北地区的创业者,将自己的人生默默植根在这块经济并不发达的土地上,在自然科学、人文科学和社会科学领域里不断探索和耕耘,丰赡地活出了自己生命的内涵。且让我们深情地记住他们,在时代的潮流中摒弃时尚、不图虚荣、脚踏实地、寄一腔挚情于祖
田野考察途中  青山行不尽,绿水去何长。古往今来,徜徉于山水田野之间者,大抵心胸开阔,博古晓今;而能将之引以为毕生志趣追求者,更是如此。蓝勇便是这样一个人。  “历史地理学是研究历史时期地理环境变迁,以及环境与人类和人类社会关系的科学,同时也是历史学中与现实关系十分密切的学科。”短短几十个字就概括了蓝勇所从事的研究领域,但道不尽的却是其后的艰难险阻、山高水长。载着简单的行囊,蓝勇在他所从事的历史地