数据治理是实现数据驱动型企业的关键

来源 :计算机世界 | 被引量 : 0次 | 上传用户:Taosnowball
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据治理并不复杂,但它的实施需要有专家的建议,而且还要熟悉企业内部,知道其特性,才能开发出带来实际利益的解决方案。
  任何企业最关键的一种资产就是数据。如今,企业产生的数据量惊人。所有这一切的核心就是数据治理。尽管这是一个热门话题,而且还有很多关于数据治理的文章和白皮书发表,但有些企业领导似乎仍然漠不关心。我们需要在这个问题上讲得更清楚些。
  数据治理是什么?
  数据治理的简单定义是针对企业数据资产管理进行治理的核心流程和策略。数据治理的主要目标是查明哪些数据和信息是重要的,建立管理数据和信息的流程,并衡量实现业务目标的工作是否有效。
  通过建立由专注于技术和业务的相关方组成的成熟部门来实施数据治理,该部门记录策略,生成控制数据对数据进行监督,采集、定义、存储数据,并分发到整个企业中。
  随着大数据的兴起以及数据源的激增,企业要处理的数据越来越多。互联设备、智能手机、社交网络和网站能收集大量有关企业表现的数据,例如,客户的感受或者竞争情况等。
  此外,分析技术使用起来也越来越方便了,能够分析这些数据,从而提高业务绩效。这两种现象催生了所谓的数据驱动型企业。
  什么是数据驱动型企业?
  简单说,数据驱动型企业指的是这类企业:经常使用分析技术来分析所掌握的数据,以便做出决策。
  在真正以数据为驱动的企业中,所有员工和管理人员在日常工作中都会以整合的方式使用数据。销售、营销和财务经理必须能够利用他们所掌握的所有相关数据,快速做出决定,从而促进业务取得成功。
  高明的数据驱动型企业能够在正确的时间,使用正确的数据,做出正确的决策。数据驱动型企业的优势还在于他们能够从业务的各个方面收集相关数据。
  与之相关的好处是,这样他们就能够更好地了解关键要素,例如,客户行为或者市场趋势等。把数据分布在整个企业中能够降低做出错误决策的風险,降低与企业数据安全相关的风险,提高效率,并减少IT支出。
  为什么要考虑数据治理?
  “治理”这个术语显然包含着质量的概念,因为这是数据治理的主要目的。为什么要考虑数据质量呢?因为糟糕的数据对业务的影响是显而易见的:货物运错了地方,客户收到的产品与广告描述的不符……,等等。然而,糟糕的数据质量可能会产生更微妙的影响:例如,由于你无法准确地识别客户所购买产品的类别而错过打折销售,由于不准确的尺寸数据使你在比较网站上名誉扫地,而导致网上销售损失,等等。
  我想你也可以问问自己,“为什么我必须在我的公司中使用数据治理?”原因是,公司的一些员工在日常工作中可能已经开始检查数据质量了。例如,会计师会核实过账是否记录在正确的账本上,会计部门会核实送出的发票,是否收到了相应的款项。
  企业的大多数运营数据已经嵌入到主动管理过程中,但在大多数情况下,人们的兴趣不仅在于数量,还在于质量。基准数据是最不受质量控制的数据,由于它会驱动很多业务流程,所以数据治理就是要为这些数据的质量建立正式的管理职责。
  数据治理导致了态度的转变:我们从被动的质量方法转向更主动的质量方法。通常,只有当一个过程失败、无法交付或者计算机系统停止工作时,我们才认识到数据质量不好。在某些情况下,这是发现问题的最佳方法。由于数据质量差而发生事故也很常见,而且没有人愿意为此承担责任!数据治理确保了责任明确到人,不仅要纠正问题,而且要降低问题发生的风险。
  可靠的数据治理策略
  越来越多的企业希望能成为数据驱动型的。然而,很多企业未能把所掌握的数据转化为可操作的信息。这类失败的主要原因往往是项目界定模糊不清,以及缺乏实现既定目标所需的人员、工具和技术。
  要使企业成为数据驱动型的,有几个步骤是必不可少的。首先,企业必须定义要衡量哪些成功指标,并将这些指标与将用于衡量的数据集相关联。这种举措使得企业能够准备好每个部门执行的具体措施,并使之与企业总体战略保持一致,根据既定目标和目的去衡量绩效。
  其次,数据和分析工具必须在整个企业中得以推广应用。否则,目标会很难实现。领导层可以通过量化并分享财务收益,参考对业务部门工作效率的影响来推动其应用。随着分析工具的推广,其应用更加广泛,协作也更好了。除了这些步骤外,还有几个关键要素对于数据驱动业务战略的成功至关重要。这包括:
  ● 一套主数据管理(MDM)工具:一套集成并维护主数据的工具和方法。这些工具与数据治理密切相关,支持企业的数据专家维护他们负责的主数据域。对于企业来说,结合其数据治理策略开发MDM策略是非常重要的。否则,数据治理项目失败的风险会被放大,最终也更有可能得到的信息不完整和不准确。
  ● 更好地理解数据的元数据管理解决方案:元数据管理解决方案支持使用定义,以及其他数据公式,帮助企业以更全面的方式理解数据。这些工具包括识别数据库表、报告、仪表盘以及可能受数据库更改影响的其他部件。因此,利用元数据管理功能,企业能够在采取行动之前分析决策的影响。
  ● 研究数据的商业智能工具:商业智能工具从企业数据中获得更好的回报。使用这些工具,用户可以研究信息子集、查询和开发预测模型。
  ● 把数据转换为信息的组织良好的数据体系结构:要把数据转换为可操作的信息,企业应采用三要素的数据体系结构。必须对每个部件进行设计和建模,以实现特定的目标。第一个部件(或要素)是“着陆区”,其中含有被提取的数据。第二个是所谓的“合规”部件,用于整合这些数据。最后,“分析”部件把数据转换为格式化的信息,从而可以被自动分析工具和其他商业智能解决方案所使用。
  ● 收集数据的提取工具:如果只有组织良好的数据体系结构,但却没有数据,也会一事无成。因此,对于数据驱动型企业来说,获取数据采集工具(也称为提取转换加载(ETL)工具)非常重要。此外,开发某种策略来理解对源系统所做的更改也是非常重要的。数据变更采集策略有助于随着时间的推移维护好历史数据。
  数据治理对于帮助决策者获得清晰、相关和一致的信息是必不可少的。数据治理有助于确保数据质量并定义KPI(关键绩效指标)。
  数据治理是数据驱动型业务的关键,因为它不仅节省了资金,而且还帮助企业更赚钱;确保数据的一致性、可靠性和可重复性;解决分析和报告问题;指导所有其他分析活动;让企业更加自信,对数据清晰明了。
  很多企业都犯了把数据治理项目的实施交给IT部门的错误,而这些项目在企业领导的直接支持下更有可能获得成功。有充分的证据表明,能访问企业主数据的应该是管理人员。当然,管理人员需要数据专家的支持,以便能够部署可靠和稳健的数据治理策略。
  最后,数据治理并不复杂。它的实施需要有专家的建议,而且还要熟悉企业内部,知道其特性,才能开发出适合自己的情况并带来实际利益的解决方案。
  Craig Brown博士是一名作家、创新和技术领域的领导者、执行导师和资深高管,在数据驱动和以数据为中心的能力方面有丰富的专业知识。
其他文献
Stack Overflow报告指出,Angular和JavaScript是这一年的主流技术  无论您是IT老专家还是有抱负的新人,都面对要跟上新兴科技以及迫切需要某些技术的巨大压力。  去年,DevOps技术和开源框架在技术排名表中有所上升,而几项需求最大而且增长最快的技术今年排名基本保持不变,排名表中排名靠后的某些技术出现了令人非常激动的变化。  在本文中,参考Stack Overflow的《
我在微软最先看到了前两代应用程序模型的转变。早期的大型机和微型计算机系统是一体式的,数据存储、应用程序代码和终端服务都在一个机箱里。20世纪80年代出现了微处理器和以太网,使得成本较低的计算机能够在局域网上协同工作和通信。PC和Unix工作站开始连接到服务器,在业务应用程序上采用了一种新的多机器、客户端-服务器编程模型。客户端-服务器应用程序出现时,图形用户界面与后端SQL数据库(通常是Oracl
尽管丹麦乃至整个欧洲,以及亚马逊都对一些事情保持着沉默,但是似乎有迹象显示他们遇到了一次黑客攻击或是一次成功的拒绝服务攻击。我是在2019年10月知道的,Google自动完成功能也会提示“AWS DDoS攻擊”。这些事情实际上会经常发生。  拒绝服务攻击的历史是否与互联网的历史一样悠久我们不得而知,因为数据中心运营商或托管服务提供商缺乏坦率的态度。过去,我们是通过防止整个网络被瘫痪来保护我们自己,
预测性分析是一款功能强大的工具,但有一件事情它无法预测,那就是用户在部署和使用该技术时遇到的问题。本文提供了一些帮助。  W. Edwards Deming是最早将统计技术和预测性分析应用于业务流程的先驱人物,他很好地诠释了这一点。他曾说过:“最大的问题就是人们一开始没有意识到自己有问题。”  当涉及到预测性分析时,“最大的问题”在规划和早期部署阶段往往并不明显,只有当随着时间的推移,技术未能達到
随着2019年的结束,许多像我一样的安全分析师倾向于汇编出一份行业预测清单。不过,目前我的工作是汇总出一份综合清单,我相信我们会看到企业安全技术正在发生前所未有的变化。这些变化已经悄然发生,但是它们将在2020年及以后变得更加明显。  发生了什么?  网络安全已成为关键业务,其属于一个动态的且可大规模扩展的高度专业化学科,但是我们仍然在使用一些传统工具和手动流程,同时还面临着人手不足的问题。这显然
2月24日,华为在2019世界移动通信大会(MWC)上正式发布了具有划时代意义的5G折叠屏手机——HUAWEI Mate X,成为华为2019年发布的首款5G手机。   HUAWEI Mate X创新采用鹰翼式折叠设计,通过华为自研的革命性铰链技术,实现一体化的完美折叠形态,兼具手机和平板两种形态, 闭合后是便携舒适的6.6英寸大屏手机,展开后变身为仅5.4毫米轻薄灵巧的8英寸平板, 沉浸式大屏
信息时代,“计算力就是生产力”已成为全球共识,算力赋能产业跨越发展已成趋势。11月3日,2020世界计算机大会主论坛在长沙举行,院士、专家、企业家代表等大咖齐聚论“算”,带来了一场计算机行业的顶级思维碰撞。而在场外,5G、VR、人工智能等赋能的相关产品亮相创新技术和产品应用成果展示区,让人深切体会到了“計算力即生产力”。   2017年至2019年,中国微型计算机产量增幅分别为5.9%、2.9%
一万多个零部件,最终被拆解为56种不同的材料用于再资源化利用,富士施乐“零废弃、零污染、零非法丢弃”的理念是如何实现的?这一过程中又有哪些经验值得我们借鉴?  刚刚过去的全国“两会”,环境保护依旧是代表委员关注的问题。今年的政府工作报告中指出:环境污染形势依然严峻,特别是一些地区严重雾霾频发,治理措施需要进一步加强。空气、水和土壤带来的问题,是每一个生活在这片土地上的人都无法独善其身的。  来自工
由于组织机构越来越重视协调控制其网络中的个人计算机、服务器和电话,以阻止恶意软件和入侵者,因此端点安全也成为了一个快速发展的类别。让我们看一下2018年将要发生什么。  端点安全在许多方面,可是说是在IT早期时候就出现的第一种计算机保护形式的直系后裔。由于组织机构越来越重视协调控制其网络中的个人计算机、服务器和电话,以阻止恶意软件和入侵者,因此端点安全也成为了一个快速发展的类别。鉴于目前许多厂商正
利用机器学习,数据中心运营商能够更好地处理散热、功耗和性能等问题。  随着企业开始采用经过数据中心大运营商和托管服务提供商试用和测试过的机器学习技术,人工智能将在数据中心运营中扮演更重要的角色。  目前的混合计算环境通常涉及到本地数据中心、云和托管站点,以及边缘计算部署。企业发现管理数据中心的传统方法并不是最优的。通过使用人工智能,正如机器学习所展示的那样,极有可能简化复杂计算设施的管理。  目前