论文部分内容阅读
5月10日,在淘宝十周年晚会上,即将卸任阿里巴巴CEO的马云说,“大家还没搞清PC时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。”
大数据时代来了,这是一个数据为王的时代,我们应有所准备,有所应对。
(一)大数据呼啸而来
早在1980年,托夫勒在《第三次浪潮》中早就预言过大数据,他说,“如果说IBM的主机拉开了信息化革命的大幕,那么大数据则是第三次浪潮的华彩乐章”。
最早提出“大数据时代到来”的是全球顶级管理咨询公司麦肯锡,麦肯锡宣称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
而真正把大数据推向公众视野的是牛津大学教授维克托·迈尔·舍恩伯格,他潜心研究大数据达10年之久,成为最早洞见大数据时代发展趋势的数据科学家之一。他的《大数据时代》专著是国际大数据研究先河之作。维克托思维的深邃之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,取而代之的是关注相关关系。只要知道“是什么”,而不需要知道“为什么”。这是对千百年来人类思维惯例的颠覆,对人类的认知及与外界交流的方式提出了全新的挑战。
大数据不是简单的阿拉伯数字的叠加,而是互联网公司在日常运营中生成、累积的用户网络行为数据,这些数据通过计算机分析系统采用二进制的海量解读,其数据规模之庞大,以至于字节单位不能用GB(1024个MB)或TB(1024个GB)来衡量,大数据的起始计量单位至少是PB(1024个TB)、EB(100万个TB)或ZB(10亿个TB)。
大数据到底有多大?互联网上一天产生的信息量有多少?据有关科学家“一天之间,互联网上要发生多少事”为主题的统计图显示,每天有2940亿封电子邮件发出,如果这些是纸质信件,在美国需要花费两年的时间来处理;每天有200万篇博客文章在网上发布,这些文章相当于美国《时代》杂志刊发770年的总量;每天有2.5亿张照片上传至社交网站Facebook,如果把它们都打印出来,摞在一起能有80个埃菲尔铁塔那么高;每天有86.4万小时的视频会被上传至视频网站Youtube,这相当于不间断播放视频98年;每天有1.87亿个小时的音乐会在流媒体音乐网站Pandora上播放,如果一台电脑从公元元年就开始播放这些音乐会,到现在还没完没了地接着放。累积起来,互联网一天之内产生的信息总量,可以装满1.68亿张DVD光盘。
一个不争的现实是,智慧城市的建设带来数据量的爆发式增长。目前,与智慧城市相关的项目所产生的数据量已超过了200PB,而大数据就像血液一样遍布智慧交通、智慧医疗、智慧生活等智慧城市建设的各个方面,城市管理正在从“经验治理”转向“科学治理”。
(二)数据为王
在大数据时代,数据为王,数据本身就是资产,也是云计算内在的灵魂和必然的升级方向。大数据到底能给企业带来什么价值呢?本质上说,大数据本身没有太多价值,基于大数据的处理和分析才能为企业带来的巨大的增值价值。大数据里面包含企业运营的各种信息,如果能对它们进行及时有效充分地整理和分析,可以迅速地有效地帮助企业进行业务决策,响应客户需求,提升竞争力。
大数据最具代表性的气质是收集和分析来自各类终端和应用的用户信息,通过组织或研究团队的智能分析,获得更多机会。其增长最快的区域毫无疑问是数字分析,有专家甚至认为,如果你是一个数据分析师,那你几乎可以进入任何你想要进入的领域,或者成为你希望的任何角色。
毫无疑问,这开创了应用的新格局。比如企业能够跟上世界经济形势找准产品涨价和降价的时间节点,卫生部门能够预测流感爆发周期,网民健康与锻炼的自我追踪,以及预测更多与我们生活密切相关的及时信息。这些信息来自各种终端和应用,PC、笔记本、智能手机、平板电脑、汽车、手表甚至眼镜等。
比较神奇的是,智能睡衣或被称为SleepShirt,通过设备来主动收集你的呼吸及睡眠模式,相关数据可通过网络上传到服务器,并通过后台算法来分析。这样,就可以洞察人们深度睡眠、做梦、清醒等不同时段,进而决定睡眠和清醒的时间,增进身体健康。
也许有一天你会惊奇地发现,生活中所有的痕迹都可以被收集,汇集成数据,并通过不同途径被分析、整合和应用。
大数据为政府管理城市提供强大的决策支持。在城市规划方面,通过对城市地理、气象等自然信息和经济、社会、文化、人口等经济社会信息的挖掘,可以为城市规划提供强大的决策支持,强化城市管理服务的科学性和前瞻性。在交通管理方面,通过对道路交通信息的实时挖掘,引导车流,能有效缓解交通拥堵,并快速应对突发状况,为城市交通的良性运转提供科学的决策依据。而在舆情监控方面,通过网络关键词搜索及语义智能分析,能提高舆情分析的及时性、全面性、针对性,全面掌握社情民意,提高公共服务能力,应对网络突发的公共事件。
再大而言,大数据在航天产业中的军事价值须臾不能离开, 通过对千里之外、万里之遥的航天器的监控,通过对以数据为载体的飞行轨迹的监控,分析国家太空的安全性。没有大数据,就没有航天产业,也没有一个国家的太空安全。
全球互联网巨头都已意识到了大数据时代数据的重要意义,谁占有数据,谁就占得先机。包括EMC、惠普、IBM、微软在内的全球IT巨头纷纷通过收购与大数据相关的厂商来实现技术整合,来壮己声威。
在中国,互联网公司围绕大数据的争夺狼奔豕突,近期奇虎360、百度、腾讯正在竞购搜狐旗下搜狗。有消息称奇虎360拟出价14亿美元,以现金加换股的形式全盘收购搜狗。而百度方面现金更加充足,能拿出更多的现金。腾讯方面的加入是因为不希望搜狗被腾讯的死对头360拿下,纯粹是从中搅局。 搜狗的价值就在于大数据。日前,全球最大数据公司之一IBM正式宣布和搜狗合作成立联合实验室,共享平台、技术资源和人才以研发基于System x的下一代数据中心和大数据运算平台。该联合实验室是IBM在华首个面向互联网行业的技术研发联合实验室,旨在通过研发前瞻性的技术来推动互联网行业基础架构的进一步优化,帮助互联网企业应对大数据挑战。这使得搜狗的身价扶摇直上,成为互联网公司拼抢的“唐僧肉”。
而工信部发布的物联网“十二五”规划中,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。而另外3项信息感知技术、信息传输技术、信息安全技术,也与大数据密切相关。这就从国家层面奠定了大数据在IT产业中的地位。
(三)准备好了吗?
大数据时代的来临,互联网基础架构的成熟,云计算技术的助推,催生了一系列新的商业模式,数据/信息服务成市场宠儿,社交网站,云服务,视频网站,数据共享网站,下载服务等等,新的市场,新的机遇。
如何通过对海量数据的挖掘与分析,发现数据中蕴藏的商业机遇,成为企业在大数据时代寻求决策依据、提升竞争力的一个重要途径。
可惜我们在大数据时代到来之时,观念上还很麻木。中国在涉及先进生产力、科技创新的重大潮流方面,总是被动地跟在美国后面追赶,我们在现代化观念上,已落后美国一个时代。
从战略上来说,中国更逊于美国一筹。美国高度重视大数据,奥巴马政府2012年3月29日发布了《大数据研究和发展计划》,提出要收集庞大而复杂的数字资料,并从中获得知识和洞见,以提升能力。而中国在大数据上还没有形成顶层设计,充其量还停留在口号阶段,没有具体作为。
在产业布局上,中国很可能像光伏产业一样,一哄而起,群龙无首,走出一条大数据狂潮的极端轨迹,大干快上大存储、大数据中心、大产业园,这样的大数据产业很可能在蜂拥而上中夭折。
有关专家指出,国内IT尤其是软件企业在布局大数据方面,已经落后。这主要是因为国内企业在数据库、数据仓库、商业智能等领域基础薄弱。
不过,国内企业拼抢大数据市场仍有机会,但需要找准行业与切入点。专家们比较看好互联网公司,像百度、阿里巴巴、腾讯,这样的互联网公司比传统的IT和软件公司更有机会。
实际上,作为中国最大的电子商务公司阿里巴巴已经在利用大数据技术提供具体服务:阿里信用贷款与淘宝数据魔方。
而继投资新浪微博、收购友盟、增持UC与丁丁网之后,阿里巴巴集团再下一城。高德软件5月10日宣布,阿里巴巴以2.94亿美元购买该公司28%股份,成为第一大股东。双方商定,将共建一个大数据服务体系,以利数据共享,高德可利用阿里巴巴的电商平台如淘宝、天猫上商家的交易信息、物流信息和地理位置信息等,从单纯的地图商转型为多元生活经销商。而阿里巴巴则可分享高德提供的地理位置、交通信息数据、兴趣点信息以及用户数据等,扩大客户。
这是马云交出阿里巴巴CEO权杖之前在大数据方面的又一大手笔,是留给阿里巴巴的一笔丰厚的大数据“遗产”。
“大家还没搞清PC时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。”重温马云的这番话,并非危言耸听,我们当有所准备,有所应对。
大数据时代来了,这是一个数据为王的时代,我们应有所准备,有所应对。
(一)大数据呼啸而来
早在1980年,托夫勒在《第三次浪潮》中早就预言过大数据,他说,“如果说IBM的主机拉开了信息化革命的大幕,那么大数据则是第三次浪潮的华彩乐章”。
最早提出“大数据时代到来”的是全球顶级管理咨询公司麦肯锡,麦肯锡宣称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
而真正把大数据推向公众视野的是牛津大学教授维克托·迈尔·舍恩伯格,他潜心研究大数据达10年之久,成为最早洞见大数据时代发展趋势的数据科学家之一。他的《大数据时代》专著是国际大数据研究先河之作。维克托思维的深邃之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,取而代之的是关注相关关系。只要知道“是什么”,而不需要知道“为什么”。这是对千百年来人类思维惯例的颠覆,对人类的认知及与外界交流的方式提出了全新的挑战。
大数据不是简单的阿拉伯数字的叠加,而是互联网公司在日常运营中生成、累积的用户网络行为数据,这些数据通过计算机分析系统采用二进制的海量解读,其数据规模之庞大,以至于字节单位不能用GB(1024个MB)或TB(1024个GB)来衡量,大数据的起始计量单位至少是PB(1024个TB)、EB(100万个TB)或ZB(10亿个TB)。
大数据到底有多大?互联网上一天产生的信息量有多少?据有关科学家“一天之间,互联网上要发生多少事”为主题的统计图显示,每天有2940亿封电子邮件发出,如果这些是纸质信件,在美国需要花费两年的时间来处理;每天有200万篇博客文章在网上发布,这些文章相当于美国《时代》杂志刊发770年的总量;每天有2.5亿张照片上传至社交网站Facebook,如果把它们都打印出来,摞在一起能有80个埃菲尔铁塔那么高;每天有86.4万小时的视频会被上传至视频网站Youtube,这相当于不间断播放视频98年;每天有1.87亿个小时的音乐会在流媒体音乐网站Pandora上播放,如果一台电脑从公元元年就开始播放这些音乐会,到现在还没完没了地接着放。累积起来,互联网一天之内产生的信息总量,可以装满1.68亿张DVD光盘。
一个不争的现实是,智慧城市的建设带来数据量的爆发式增长。目前,与智慧城市相关的项目所产生的数据量已超过了200PB,而大数据就像血液一样遍布智慧交通、智慧医疗、智慧生活等智慧城市建设的各个方面,城市管理正在从“经验治理”转向“科学治理”。
(二)数据为王
在大数据时代,数据为王,数据本身就是资产,也是云计算内在的灵魂和必然的升级方向。大数据到底能给企业带来什么价值呢?本质上说,大数据本身没有太多价值,基于大数据的处理和分析才能为企业带来的巨大的增值价值。大数据里面包含企业运营的各种信息,如果能对它们进行及时有效充分地整理和分析,可以迅速地有效地帮助企业进行业务决策,响应客户需求,提升竞争力。
大数据最具代表性的气质是收集和分析来自各类终端和应用的用户信息,通过组织或研究团队的智能分析,获得更多机会。其增长最快的区域毫无疑问是数字分析,有专家甚至认为,如果你是一个数据分析师,那你几乎可以进入任何你想要进入的领域,或者成为你希望的任何角色。
毫无疑问,这开创了应用的新格局。比如企业能够跟上世界经济形势找准产品涨价和降价的时间节点,卫生部门能够预测流感爆发周期,网民健康与锻炼的自我追踪,以及预测更多与我们生活密切相关的及时信息。这些信息来自各种终端和应用,PC、笔记本、智能手机、平板电脑、汽车、手表甚至眼镜等。
比较神奇的是,智能睡衣或被称为SleepShirt,通过设备来主动收集你的呼吸及睡眠模式,相关数据可通过网络上传到服务器,并通过后台算法来分析。这样,就可以洞察人们深度睡眠、做梦、清醒等不同时段,进而决定睡眠和清醒的时间,增进身体健康。
也许有一天你会惊奇地发现,生活中所有的痕迹都可以被收集,汇集成数据,并通过不同途径被分析、整合和应用。
大数据为政府管理城市提供强大的决策支持。在城市规划方面,通过对城市地理、气象等自然信息和经济、社会、文化、人口等经济社会信息的挖掘,可以为城市规划提供强大的决策支持,强化城市管理服务的科学性和前瞻性。在交通管理方面,通过对道路交通信息的实时挖掘,引导车流,能有效缓解交通拥堵,并快速应对突发状况,为城市交通的良性运转提供科学的决策依据。而在舆情监控方面,通过网络关键词搜索及语义智能分析,能提高舆情分析的及时性、全面性、针对性,全面掌握社情民意,提高公共服务能力,应对网络突发的公共事件。
再大而言,大数据在航天产业中的军事价值须臾不能离开, 通过对千里之外、万里之遥的航天器的监控,通过对以数据为载体的飞行轨迹的监控,分析国家太空的安全性。没有大数据,就没有航天产业,也没有一个国家的太空安全。
全球互联网巨头都已意识到了大数据时代数据的重要意义,谁占有数据,谁就占得先机。包括EMC、惠普、IBM、微软在内的全球IT巨头纷纷通过收购与大数据相关的厂商来实现技术整合,来壮己声威。
在中国,互联网公司围绕大数据的争夺狼奔豕突,近期奇虎360、百度、腾讯正在竞购搜狐旗下搜狗。有消息称奇虎360拟出价14亿美元,以现金加换股的形式全盘收购搜狗。而百度方面现金更加充足,能拿出更多的现金。腾讯方面的加入是因为不希望搜狗被腾讯的死对头360拿下,纯粹是从中搅局。 搜狗的价值就在于大数据。日前,全球最大数据公司之一IBM正式宣布和搜狗合作成立联合实验室,共享平台、技术资源和人才以研发基于System x的下一代数据中心和大数据运算平台。该联合实验室是IBM在华首个面向互联网行业的技术研发联合实验室,旨在通过研发前瞻性的技术来推动互联网行业基础架构的进一步优化,帮助互联网企业应对大数据挑战。这使得搜狗的身价扶摇直上,成为互联网公司拼抢的“唐僧肉”。
而工信部发布的物联网“十二五”规划中,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。而另外3项信息感知技术、信息传输技术、信息安全技术,也与大数据密切相关。这就从国家层面奠定了大数据在IT产业中的地位。
(三)准备好了吗?
大数据时代的来临,互联网基础架构的成熟,云计算技术的助推,催生了一系列新的商业模式,数据/信息服务成市场宠儿,社交网站,云服务,视频网站,数据共享网站,下载服务等等,新的市场,新的机遇。
如何通过对海量数据的挖掘与分析,发现数据中蕴藏的商业机遇,成为企业在大数据时代寻求决策依据、提升竞争力的一个重要途径。
可惜我们在大数据时代到来之时,观念上还很麻木。中国在涉及先进生产力、科技创新的重大潮流方面,总是被动地跟在美国后面追赶,我们在现代化观念上,已落后美国一个时代。
从战略上来说,中国更逊于美国一筹。美国高度重视大数据,奥巴马政府2012年3月29日发布了《大数据研究和发展计划》,提出要收集庞大而复杂的数字资料,并从中获得知识和洞见,以提升能力。而中国在大数据上还没有形成顶层设计,充其量还停留在口号阶段,没有具体作为。
在产业布局上,中国很可能像光伏产业一样,一哄而起,群龙无首,走出一条大数据狂潮的极端轨迹,大干快上大存储、大数据中心、大产业园,这样的大数据产业很可能在蜂拥而上中夭折。
有关专家指出,国内IT尤其是软件企业在布局大数据方面,已经落后。这主要是因为国内企业在数据库、数据仓库、商业智能等领域基础薄弱。
不过,国内企业拼抢大数据市场仍有机会,但需要找准行业与切入点。专家们比较看好互联网公司,像百度、阿里巴巴、腾讯,这样的互联网公司比传统的IT和软件公司更有机会。
实际上,作为中国最大的电子商务公司阿里巴巴已经在利用大数据技术提供具体服务:阿里信用贷款与淘宝数据魔方。
而继投资新浪微博、收购友盟、增持UC与丁丁网之后,阿里巴巴集团再下一城。高德软件5月10日宣布,阿里巴巴以2.94亿美元购买该公司28%股份,成为第一大股东。双方商定,将共建一个大数据服务体系,以利数据共享,高德可利用阿里巴巴的电商平台如淘宝、天猫上商家的交易信息、物流信息和地理位置信息等,从单纯的地图商转型为多元生活经销商。而阿里巴巴则可分享高德提供的地理位置、交通信息数据、兴趣点信息以及用户数据等,扩大客户。
这是马云交出阿里巴巴CEO权杖之前在大数据方面的又一大手笔,是留给阿里巴巴的一笔丰厚的大数据“遗产”。
“大家还没搞清PC时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。”重温马云的这番话,并非危言耸听,我们当有所准备,有所应对。