京东数字科技集团大数据部总经理张旭:数据资产管理

大家好,非常感谢信通院组织和邀请,今天下午能够抛砖引玉,跟大家分享一下我自己的心得和京东数科在数据资产方面的工作。刚才何所也提到了数据是原油的概念,几年前数据做数字资产讨论的时候一直在提这个观点,但是很少有人真的理解它到底是什么含义。

  以上是我自己在这方面的理解,Data is new oil,oil其实是原油的意思,而不是汽油。数据和原油之间是很有相似的地方的,首先石油是经过几千万年沉淀下来的,数据也需要沉淀。我们不断的数据生产、采集、清洗、处理的时候,我们要根据业务,把一些有用的数据沉淀下来,所以跟石油一样是需要沉淀的。第二石油是需要提炼的,如果石油没有经过提炼的话,是不可能有其他衍生品的,包括数量、汽油,而数据也需要,数据需要清洗,数据也需要提炼和规整。

  石油跟数据有不同的地方在于,石油是不可再生资源,但是数据是可再生资源,而且数据通过再生之后才会产生更大的价值。另外一个比较有意思的地方是,石油工业中会有沙特和OPEC,数据是没有国家地限的,可以在世界任何地方产生。我们说数据是一种资产,那是谁的资产?会有这样的概念。提及数据资产必然要提到数据确权,而数据确权是世界上一个讨论非常热烈的难题。只有通过数据确权,最后我们才能把数据资产说清楚,但是因为数据确不了权,所以数据资产是否能说清是一个问题。

  石油不仅作为生产资料,带来了很大的科学进步的贡献,石油还给我们带来了战争,而且是有硝烟的战争。如果数据跟石油有相同的特性,那么数据会不会给我们带来战争?其实也会。下一场战争一定会在数据资产上,但也许是一场没有硝烟的战争。如果数据确权做不下来,如果数据资产没有办法更好的分配,我们带来的就是数据战争,其实这个数据战争在以前,国外收集中国DNA数据的时候其实就已经开始了。

  中国是世界上的第一人口大国,中国移动端数据产量也是世界第一大的,这些数据作为一种资源是否被保护了?我们说数据确权比较难,给大家举一个例子,大家都有身份证和手机号,这是你自己的还是政府的?政府给你颁发了身份证号,运营商给你颁发一个手机号,这条数据到底归谁所有?这其实是很难确权的一个问题。

  如果数据是一种资产,资产必然是要被管理的,而数据资产管理到目前为止有很多的复杂性,它是动态复杂的数据,是根据业务不断发展增加的,但是我们的业务也会有更多的需求增加,我们会不断的面临各种各样的数据质量问题。这些问题其实都是一些大的数据生产方和使用方所面临的问题,而作为京东数科除了其他的挑战以外,我们还面临着自己自身业务和管理系统众多,数据将面临相当复杂的挑战,作为内部管理我们也有很多的,在其他企业也许存在,也许不存在的一些难题。

  我们怎么样处理这些难题呢?在整个数据资产管理方面是结合的数据治理,形成了自己的小方法论,这是我们团队在整个数据治理方向上提供的整个思路。因为我们做数字科技的时候,我们前身是京东金融,之前我们做互联网金融业务,现在有智慧城市、城市计算、农牧、广告、机器人、安防,所以我们现在是数据生产到数据采集、处理、应用,产生数据价值回路的,一个全链条,端到端的数据和使用过程。我们更希望能把数据作为一条生产线来比喻,传统的生产线从原厂到卸载一直到备货生产,数据一样,有业务系统层的业务生产,有数据缓冲,一整条链路下来,我们做的是数据的保值,怎么样能让数据一开始的价值保留下来,并且发挥,下面到我们的数据应用就会有一个增值的过程,如何让数据产生更多的价值。

  由于这条生产线的存在,当我们做组织结构以及系统划分的时候,就衍生出了自己内部的数据和外部的数据,同时我们组织了数据中台部门,专门用来做数据的保值增值的工作。最后数据的价值一定会体现在对外的业务方面,所以最后是各个部门以及对外部门的业务和服务能提供数据本身的价值。

  整个数据资产的建设思路是这样矩阵式的整个建设方向,整个一列是数据规划以及治理、运营的工作方向。基本上我们前期会花一年的时间做数据整体运营体系规划,包括整个运营发展蓝图,组织架构的设计,数据标准、数据质量的管理。我们现在在做的事情,是在中期,做整套集团数据处理,这个时间规划基本上是1—3年的时间。包括如何调整数仓管理,数据模型,最后我们的目标是三年之后能够有一个更长期,更远期的发展,数据治理、数据发展不是一蹴而就的工作,所以在这当中会不断发生、发展、演变,这是一个长期的过程。

  互联网公司基本上是结果导向的,所以我们不太会提出我们做了什么,而是说我们做完之后成就了什么。到目前为止我们已经完成整个数科集团数十万张表的盘点工作,形成了一套数据盘点的方法论以及数据地图,还有知识图谱。我们在数据资产方面提供了七个维度的数据资产管理的办法,在数据资产方面我们现在能做到的,比以前在我们做数据治理之前,能够为用户平均节省50%以上的查找时间,这完全归结于当初做的数据治理,花了很大的人力做数据治理,去收集原数据,绘制数据地图。

  另外数据如果不被使用,它就没有自身的价值,所以我们现在能做到的是让公司90%的人都能用数据。当初我来这家公司的时候就说过,什么时候能够做到这是一家数字驱动的公司了,这个公司里面所有的人做决策的时候,看运营的时候,做下一个新业务的时候,第一能想到看一看数据能帮助我什么,这就是一家数据公司了。

  这是供给端到需求端的供求关系闭环管理,这就提到了数据再生,除了把数据整理到供给之外,我们要形成一个再生的过程,才能让数据资产发挥最大的价值。

发布了19 篇原创文章 · 获赞 0 · 访问量 9402

猜你喜欢

转载自blog.csdn.net/yuxinqingge/article/details/104584068