论文部分内容阅读
《华尔街日报》曾以“后PC时代”的四大科技巨头为例,点评了云产业时代所售卖和展现出的内容特质。Amazon、Facebook、Google和Apple,无论是搭平台还是卖能力,其最终价值都体现在直接或间接售卖的数据上。通过对数据本身的处理和分析,产品和服务的投放更加精准、高效。与此同时,传统的消费电子产品也被打上“互联网产品”的标签,在IT消费化的趋势下,传统的IT服务从企业端扩展到个体消费者。云平台的搭建无疑加速了这一过程,而多样的智能化终端和大量的数据积累则是其直接表现。
大数据能力关乎企业智商
站在企业用户的角度看,大数据使其在商业模式上发生了转变。数据本身和其背后所蕴含的价值正日益成为企业的重要资产,作为一个新的商业模式为企业获取巨大的盈利空间。
例如,人们传统印象中趋向保守的金融行业恰恰是大规模部署大数据应用的行业。在金融业的风险评估业务中,需要建立相应的风险模型,并且在算法交易时执行毫秒级的响应请求以确保投资交易的成功,这些需求需要新的系统架构以及相应的大数据处理和分析能力提供支持。
大数据与企业本身直接相关的能力主要表现在两方面。第一个能力是识别,对于企业来说,能够有效识别用户的能力成本是非常高的,尤其是针对个性化用户的识别和推介,而识别是靠数据本身来支撑的。第二个能力是感知,在对个体用户识别的基础上,如何感知到整个市场的变化。
例如在今天可以通过对未知的海量上网行为数据的分析评估某款新上市手机和其市场竞争对手产品的浏览率,以此感知竞争环境并对市场做出有效响应和干预。又比如,在银行的风险评估体系中,18岁以下的用户刷信用卡的风险要明显大于其他年龄段的消费者。这些探索与发现正是基于大量数据由系统捕捉到的,而不是由专业业务人员给出的。
企业的数据处理、融合和分析挖掘能力将直接关系到企业智商和竞争力。从融合的角度看,数据的价值在于催生新的服务形态。
大数据服务形态
大量数据的积累催生了数据多样化的服务形态,而这些服务形态也正是大数据落地的应用方式。第一种就是数据服务本身,数据服务更多的是提供一些资源服务,以及一些传统的数据能力服务,比如数据的保存、长期历史数据的留存等。还有面向大企业的一些专业维护,例如基于数据加工的容灾能力等。在长期数据保存里一个很核心的问题就是迁移成本。通过将数据保存在分布式的大数据平台之上,企业能够满足更加细化的数据存储需求。
第二种服务形态是信息服务。在现在PB级的存储系统中,检索数据无异于大海捞针。传统的数据检索是靠数据库,是靠文件系统命名的。这种检索方式在检索和查询影像文件时可能会遇到障碍,问题发生在当影像文件超过了文件系统的厚度时。此外,关于数据库表结构定义的不一致性和标准缺失也是数据库检索的另一大问题。如何有效解决这些问题?通过互联网基于对象的索引技术,将图像文件通过标准的协议转化成缩略的数据封装起来,不仅解决了文件共享问题,同时也可适用于统计分析和查询。这种技术模式实际上就是基于新的大数据架构的。在北美,PaaS服务的一个新形态是以大数据为主的计算,提供弹性的服务。许多企业面对大量的数据处理需求,通过Hadoop集群在短时间内获取计算结果。
第三种服务形态是知识服务。在数据服务和信息加工的基础上,数据融合开始体现出价值。例如,通过对金门大桥附近地质活动数据长达100年的数据采集,形成了一个有效的范本数据,这是通过长时间的数据积累达成的。又比如,一些基金公司购买大量的气象数据,目的是服务企业对相关农产品的市场预估,数据价值的广度属性更加丰富。随着数据本身的积累,企业对行业领域的认知会越来越深,运用大数据的能力成为企业对市场和行业施加影响和干预的重要手段。例如,大数据分析可以帮助零售行业的企业做动态定价,进而形成广泛的行业经验。
大数据能力关乎企业智商
站在企业用户的角度看,大数据使其在商业模式上发生了转变。数据本身和其背后所蕴含的价值正日益成为企业的重要资产,作为一个新的商业模式为企业获取巨大的盈利空间。
例如,人们传统印象中趋向保守的金融行业恰恰是大规模部署大数据应用的行业。在金融业的风险评估业务中,需要建立相应的风险模型,并且在算法交易时执行毫秒级的响应请求以确保投资交易的成功,这些需求需要新的系统架构以及相应的大数据处理和分析能力提供支持。
大数据与企业本身直接相关的能力主要表现在两方面。第一个能力是识别,对于企业来说,能够有效识别用户的能力成本是非常高的,尤其是针对个性化用户的识别和推介,而识别是靠数据本身来支撑的。第二个能力是感知,在对个体用户识别的基础上,如何感知到整个市场的变化。
例如在今天可以通过对未知的海量上网行为数据的分析评估某款新上市手机和其市场竞争对手产品的浏览率,以此感知竞争环境并对市场做出有效响应和干预。又比如,在银行的风险评估体系中,18岁以下的用户刷信用卡的风险要明显大于其他年龄段的消费者。这些探索与发现正是基于大量数据由系统捕捉到的,而不是由专业业务人员给出的。
企业的数据处理、融合和分析挖掘能力将直接关系到企业智商和竞争力。从融合的角度看,数据的价值在于催生新的服务形态。
大数据服务形态
大量数据的积累催生了数据多样化的服务形态,而这些服务形态也正是大数据落地的应用方式。第一种就是数据服务本身,数据服务更多的是提供一些资源服务,以及一些传统的数据能力服务,比如数据的保存、长期历史数据的留存等。还有面向大企业的一些专业维护,例如基于数据加工的容灾能力等。在长期数据保存里一个很核心的问题就是迁移成本。通过将数据保存在分布式的大数据平台之上,企业能够满足更加细化的数据存储需求。
第二种服务形态是信息服务。在现在PB级的存储系统中,检索数据无异于大海捞针。传统的数据检索是靠数据库,是靠文件系统命名的。这种检索方式在检索和查询影像文件时可能会遇到障碍,问题发生在当影像文件超过了文件系统的厚度时。此外,关于数据库表结构定义的不一致性和标准缺失也是数据库检索的另一大问题。如何有效解决这些问题?通过互联网基于对象的索引技术,将图像文件通过标准的协议转化成缩略的数据封装起来,不仅解决了文件共享问题,同时也可适用于统计分析和查询。这种技术模式实际上就是基于新的大数据架构的。在北美,PaaS服务的一个新形态是以大数据为主的计算,提供弹性的服务。许多企业面对大量的数据处理需求,通过Hadoop集群在短时间内获取计算结果。
第三种服务形态是知识服务。在数据服务和信息加工的基础上,数据融合开始体现出价值。例如,通过对金门大桥附近地质活动数据长达100年的数据采集,形成了一个有效的范本数据,这是通过长时间的数据积累达成的。又比如,一些基金公司购买大量的气象数据,目的是服务企业对相关农产品的市场预估,数据价值的广度属性更加丰富。随着数据本身的积累,企业对行业领域的认知会越来越深,运用大数据的能力成为企业对市场和行业施加影响和干预的重要手段。例如,大数据分析可以帮助零售行业的企业做动态定价,进而形成广泛的行业经验。