数据当中蕴含价值。随着客户数据规模的持续增长,相关保护工作也变得更具挑战性,同时越来越多企业开始寻求新型数据治理策略以管理如此庞大同时与企业命脉怎么样的重要信息。毫无疑问,数据已经成为信息经济体系中的原始素材,而数据治理也在战略层面上成为亟待解决的当务之急。
在昨近期麻省理工学院首席数据官论坛的theCUBE研讨环节上,SAP公司美国分部全球运营副总裁Tina Rosario表示,数据治理正随着数据分布化趋势的不断增长而获得愈发重要的地位。“如今的数据不再局限于内部环境或者员工的个人笔记本,”她解释称。“时至今日,数据的载体可以是iPad或者其它任何设备类型。其分布式特性如此显著,因此需要卓越的治理手段加以配合。”
数据治理到底是怎么一回事?
Wikibon公司分析师Jeff Kelly询问Rosario如何对数据治理概念加以定义,对方的回答是:数据治理可以被划分为四大主要因素——良好的组织、执行流程、维护以及技术性解决方案。
“第一项重点在于良好的组织,也就是围绕数据治理开展的实践活动——包括规则、标准以及政策等等,”Rosario指出。“其次,我们会寻求正确的执行流程以简化、创建、更新并维护数据。我们还会从持续维护的角度出发对数据中以审视,例如借助理想的执行方式与工具实现数据的自动化维护——因为我们很清楚,数据价值一直处于衰减当中。”
很多朋友可能在接触SAP的数据治理方案时,第一反应是将其视为劳动力型任务来看待——这非常正常。不过实际情况并非如此,因为Rosario的团队一直努力避免就数据本身进行过多讨论。“我们致力于将其加以拆分,并帮助客户弄清楚企业需要什么、哪部分信息对于业务运营流程最为关键——这才是大家真正关心且能够理解的部分。”她解释道。“我们将关注重点放在这些方面,并高度重视相关核心信息,这才是我们需要加以治理的内容。”
Rosario认为,获得成功的关键因素在于从使用者的角度出发考量数据治理方案。她表示,可能没人会想到数据本身会存在问题,但人们在实际使用时会发现他们所需要的某些信息无法访问或者发现自己无法完全信任这部分数据结论。“我们努力从这些角度审视数据内容,并考虑自己能通过哪些手段帮助客户获得更为高效的业务执行流程,”她指出。“我们该如何更快从数据中获取分析结论,并保证所交付内容的正确性。”
从另一个角度看,确保数据治理团队拥有理想的协作关系同样非常重要,只有这样其对数据的分析结果才能真正成为推进业务目标的动力。正如她向Jeff Kelly作出的解释,数据治理团队的工作之一在于确保企业用户的数据具备正确的质量与标准水平,这样分析人士才能对其进行访问且不必把时间浪费在构建目标关系身上。
“分析人士会对我们提出要求,”Rosario球。“他们会走过来直言‘我们打算运行这套报告机制、我们需要这一级别的数据,你们能帮助确保我们从正确的来源获取到具备正确质量水平的数据、并能够切实对其加以访问吗?这是我们之间紧密共生关系的一种缩影。”
这种关系同时也是双向起效的,因为数据治理团队的一部分工作在于分析数据质量水平,为了完成这项任务他们需要参考来自分析人士的专业意见。“我们彼此之间拥有良好的合作关系,他们为我们提供实现上述目标所必需的工具以及分析机制,”她指出。
云环境带来的复杂性
通过Rosario的讲解,大家可能认为数据治理并不是什么难事,但他们在SAP的实际工作中实际面临着众多阻碍。Dave Vellante问到她的团队在处理任务时遵循怎样的优先级考量,她表示目前最大的挑战来自云环境给数据治理带来的复杂性。
“SAP希望转型为一家云服务企业,为了实现这一目标、他们需要将一部分云机制引入内部环境,那么我们该如何对云当中的数据进行治理?”她提出了一直困扰着团队的难题。
最大的难关之一在于SAP数据的分布式特性。该公司以混合型环境为运作基础,其中一部分数据处于内部环境、一部分处于云环境中,而且目前有越来越多的数据开始以云作为载体。她的团队在探寻此类条件下的数据治理方案时遇到了一系列挑战。
“分布式特性正变得愈发显著,很多人会单纯将其视为复杂性的提升、但我却同时将其作为重要的发展机遇,并希望借此构建起更多治理手段与传播渠道,”Rosario表示。