本体技术视点 | 数据业务场景中的可信流动(三)

图片

此前,我们发布了本体首席技术专家 Ning Hu 在由 ECUG 社区主办的 2021 ECUG Con 全球技术大会上做出的分享第一期和第二期:本体技术视点 | 数据的去中心化协作和可信流动(一)本体技术视点 | 数据的中心化协作和可信流动(二)。介绍了“去中心化”、“去中介化”、”多中心化“的几种形态,以及在各类形态下的工作模式。

图片

图 | 网络

本期我们继续围绕这一话题,与具体的数据业务相结合进行探讨。

04 关于数据业务/Data Business

数据业务亟待解决的问题主要包括4个方面:

- 数据拥有方对数据本身隐私性的安全需求

有的数据可以以副本的形式提供给数据协作的对手方,有的数据对其他第三方不可见。

- 终端用户准入门槛高

已有的数据服务偏重于企业级用户,缺乏基于个人用户数据的个人服务,因此在个人数据确权的环节有缺失。

- 数据在流动过程中不可被篡改

没有被非授权的第三方获取,以一种可信的方式从一方流动到另一方。

- 作恶与数据服务高效性

一个数据服务体系需要配套相应的清结算服务,以激励数据提供方提供高质量的数据,数据处理算法提供方提供高质量的数据处理算法。

图片

在这样的背景下,我们引入 SAGA 网络,可以将其视为“数据流通的连接器”,在保证数据角色确权的情况下,提供完整的数据生命周期管理,实现链上链下融合、可信安全、高效集成。当我们描述数据处理的时候,其实关注有不同参与方,包括算法提供方,数据提供方,包括数据的加工场所,SAGA 致力于成为可以集成协议和操作灵活的一站式平台。

图片

目前来说,有很多包括联邦学习、MPC、多方计算等技术手段来保护数据隐私。在某些情况下,数据的提供方不愿意把数据暴露给加工方或者是数据购买方。但是实际的数据应用中间会出现一些情况。举个例子:我需要百万级体量的数据,但是只找到3家采购方,他们只能测试40万亿条数据,这时候就需要一个场所,提供120万亿条数据一起进行计算

但是数据供应方之间有需求,他们不希望数据互相可见,这里需要具备给竞争对手提供数据的能力。这时可以有很多计算方式作为选择,包括可信执行环境(TEE)这种第三方提供的一些平台保证,还有联邦计算。在数据结构和数据算法没有那么复杂的时候,会考虑用一些算法做支持,但不管怎样,核心都是要保证三方的安全性。

这个时候,我们需要沿用之前区块链的逻辑,考虑什么样的架构能够予以支持。基本上我们会考虑通过跨系统协作,为数据互操作提供确权的证明,这是通过区块链来实现。大数据是一笔生意,所以需要有相对资产化的方案。

这其中一个核心的要点是分布式的多元数据加工网络,这个多元数据加工网络一定程度上也可以借鉴多中心的逻辑。与此同时,仍然需要有一些开放式的数据计算框架。这当中的核心是一个服务网络,该服务网络后台关注的点由区块链来完成的是权限管理这一块。对于区块链,特别是多中心网络来说,我们希望达到的目标是比较少的“写”,但是比较多的“读”,和分布式网络一样。但事实上我们描述区块链网络的时候,我们希望做到快速的“读写”,这里面是相互矛盾的。如果做权限管理这一块的话,通过区块链进行控制,可以大大降低在业务时候的写的状态,所以在一定程度上缓解了这部分的矛盾。

同样,在数据的分布式计算网络里面,可以有不同的区块链,不同的中心化系统,已有的互联网系统都可以引入进来。如果有需要他们可以用子化的方案,直接跟现有的客户端进行沟通。

图片

图 | 网络

接下来分享一下目前我们使用的一些场景。公链是一个全球分布运营的实体,所以这在地域合规层面会具备一定的困难。

在公链上面信任背书的方式通过治理来实现,这个治理一般与费用相关。但是联盟链没有这个问题,因为联盟链一般是通过合同促成,所以是法律背书的逻辑,它的信任背书通过法律得到保证。

一般的情况下,我们会考虑在联盟链之间仍然有需求的话,可以借助第三方,一般来说可以是公链,来提供基础设施的支持,可以通过联盟链来支持令牌化、资产化,来保证上层正常的业务运营。

同时,对人、财、物、事,包括智能设备,包括合作方都是通过前面提到的 DID,去中介化的身份进行管理。


未完待续......

如有任何问题,可通过 [email protected] 联络我们。

添加“ontology_2020”并备注【技术】可进行技术探讨或加入社群。

图片

猜你喜欢

转载自blog.csdn.net/ontologycoding/article/details/117956854