数据流通的三大问题和解决之道

tech2022-08-27  127

新时代下,数据成为重要生产要素,各行各业都在积极推动“加快培育数据要素市场”相关工作。然而,作为一种新型生产要素,数据要素市场的培育并不容易。

数据归属于不同主体、存在于不同机构,具有场景化、碎片化等特征,数据源多而零散,类型复杂多样、标准不一,数据交换缺乏信任源、数据安全难以保障,这些都给数据的可信流通带来诸多困难。

 

  数据流通面临的挑战

我们从数据源头,即数据所有者的角度分析数据流通过程中面临的挑战,发现数据确权难、隐私保护性低和用户激励不足是数据流通中的三大痛点。

 

首先,数据权属难以界定和保障。造成这种局面的核心原因在于数据具有非排他性和可复制性。

不同于传统的土地、劳动力等生产要素,数据在流通过程中不但不会被消耗殆尽,反而越用越多,这也增加了确定数据归属的难度。

理论上,作为数据的主体,用户享有支配数据的权利,但事实上,数据往往不由用户掌握,不论是社交数据,还是消费数据,都保存在各个服务提供方的数据库中,被当成互联网公司的核心资产,在用户毫不知情的情况下被计算分析,进而牟取利益。

第二,用户的数据隐私难以得到保护。即便当前大多数的服务提供方都会在用户协议中做出数据流通的相关提示并取得用户授权,但能坚持并贯彻全流程用户知情权的服务提供方非常少。

举一些常见例子,我们在购物网站上浏览或购买商品后,不少购物网站会将我们的行为数据用于信息流平台广告投放,以获得更多销量,但是购物网站到底提供了哪些数据给信息流平台,我们无从知晓。

更或者,当我们频繁看到曾经搜索过的商品推荐时,当我们总是收到商品营销短信甚至快递诈骗电话时,当我们清楚地意识到自己的消费信息被泄露时,有没有办法停止被侵权,该如何撤销授权,能不能取证并向侵犯我们数据权利的一方要求终止服务或赔偿,这些仍是亟待解决的问题。

第三,缺乏用户激励。数据市场的可持续发展,离不开用户积极参与。然而,现阶段在绝大多数场景下,用户作为数据主体的价值未能得到体现,市场也缺少高效的激励机制去驱动用户积极参与数据流通。

因此,数据确权难、隐私保护性低和用户激励不足成为了数据时代下大家共同面临的难题。那么,区块链在其中能发挥什么作用,能否成为一剂促进数据流通的良药呢?

 

  区块链解决数据确权难

从2009年开始,我国已出台了一系列数据相关的法律法规,可以看出,我国对数据的监管不断趋于严格、趋于全面。在经济建设和社会发展的过程中,体现数据价值的前提是,必须有效保障数据主体的合法权利。

国内数据监管法律体系研究

我们来看看如何利用区块链解决数据确权这个问题。理论上,对于可以流通的数据,不论是收集、处理、传输、使用还是销毁等行为,都必须获得数据主体的授权。那么,如何证明数据是谁的、数据是合规的、数据得到了数据主体的授权呢?

首先,不论要证明的是什么,数据的不可篡改性是保障数据可信流通的重要基础。区块链所采用的分布式存储、加密算法、共识机制等核心技术,使得链上数据具有不可篡改性,与数据权属存证的需求是天然契合的,在构建多方信任方面具有天然优势。

其次,作为当前国内区块链发展的主流方向,联盟链有其解决之道。联盟链具有准入机制,仅限特定某个群体的成员和有限的第三方参与,数据提供方和使用方等须经过资质审核后才能加入,且必须遵守约定的数据流通规则。通过分级的权限控制及预先设定的智能合约,可以更好地规范数据流通行为,进一步保障链上数据合法合规。

再者,在控制准入的基础上,区块链为用户发行自主可信的分布式数字身份。作为该数字身份的主人,用户可以对身份信息及身份相关联的数据进行管理和授权。

区块链的可验证数据凭证可对用户数据进行加密存证,当数据进入流通池后,加密的数据凭证hash上链,后续授权、获取、验证等一系列操作也都进行全流程链上记录。不仅可以帮助数据使用方验证数据真实性、合法合规地使用数据,还可以实现全流程透明可追溯,有效保护数据主体权益。

微众银行区块链2018年推出的实体身份认证及可信数据交换解决方案WeIdentity,就是这个领域具有代表性的解决方案,目前已经在版权保护、司法仲裁、网络投票和物联网等多个生产应用场景中得到了验证。

目前,很多区块链平台还接入了版权局和司法机构作为链上节点,可快速同步数据,降低电子数据存证成本。

例如,2019年微众银行区块链联合人民网上线的人民版权平台,依托区块链技术,平台将作者姓名、登记时间、作品名称、作品摘要等信息加密后进行电子存证,实现链上信息可追溯且无法篡改。

一旦发生侵权行为,同为链上节点的司法机构可以直接从链上校验电子证据,快速判定版权纠纷,从而大幅降低司法过程中的证据取证与保全成本,用传统手段一半的价格便可完成确权、维权等全流程,帮助用户以最小成本、最高效率成功维权。

  区块链保护数据隐私

在更大范围流通和使用数据,可以让数据发挥出更大的价值,但这也意味着数据可能会面临更大的安全和隐私风险。

相信大家都接到过推销房产、股票、贷款等业务的电话,对方不仅知道我们的姓名、手机号,甚至还知道我们的身份证号。这些都是我们的隐私数据,在个人隐私问题日益严峻的今天,让人不由得担心,数据流通是否会加剧隐私泄露?

解决隐私保护问题,常常谈到道德和法律两个层面,好消息是两个层面我国都已经取得了很大进步。

一方面,用户对个人隐私数据的保护意识正在不断增强,不轻易填写个人真实身份信息、不泄露他人隐私数据逐渐成为共识。

另一方面,我国先后出台了《中华人民共和国密码法》、《中华人民共和国网络安全法》、《信息安全技术个人信息安全规范》等一系列法律法规,规范数据市场,不仅为存量业务中数据主体的合法权益提供了保障,也为发掘包括金融数据、医疗数据、民生数据等在内的高价值隐私数据提供前所未有的商业机遇。

在实际操作层面,已有多种技术手段落地用于保障数据隐私。近年来,区块链隐私保护方案受到业界广泛关注。依托区块链等分布式可信智能账本技术,融合加密算法、零知识证明、脱敏算法、选择性披露、安全多方计算等专业领域前沿成果,可以兼顾用户体验和监管治理,实现公开可验证的隐私保护效果。

举一个选择性披露的例子,当你去听线下脱口秀开放麦的时候,因为开放麦限定大于18岁才能入场,所以订票及入场时,需要提供姓名、手机号、身份证号等个人信息。

多次明文提供个人信息,显然加大了自身隐私信息泄露的风险,然而实际上,提供个人信息的目的,仅仅是为了证明订票人年满18岁。那有没有方法既可以证明自己确实成年,又不需要暴露个人信息呢?

选择性披露就可以做到。选择性披露方案可以在不依赖可信第三方服务和可信硬件执行环境的前提下,支持从任意类型的数据集合中选取部分数据进行披露,并支持基于部分数据的断言判断,实现最大化隐私保护效果。

通俗点说,根据不同业务需要,可以选择性披露用户的年龄“判断”(例如大于18岁),也可以选择性披露用户年龄属于某个区间(例如介于18岁到25岁之间),而不必披露具体年龄,更无需直接提供用户身份证号码。

在上述场景中,如果采用选择性披露方式,将用户的姓名、手机号、身份证号等身份信息生成加密的可验证凭证,用户可以选择仅披露年龄判断,便可以有效地防止信息明文暴露,达到保护用户隐私的目的。

微众银行区块链WeDPR方案便是一个集大成的高效隐私保护技术方案,其中的选择性披露架构如图2所示(更多内容可以参考《WeDPR白皮书》)。

WeDPR选择性披露架构

 

  区块链激励用户参与意愿

数据是有价值的,而且数据的价值往往需要通过数据流通来实现,这是大多数人已有的共识,我们能够看到,数据流通的需求是普遍存在的。

然而,为何在市场需求旺盛、政策支持鼓励等多个利好因素影响下,数据市场的发展仍处于初级和探索阶段,迟迟未能形成行业规范和规模效应呢?其中一个原因,是数据主体的意愿和价值未能得到体现。即便解决了数据确权和数据隐私问题,用户就愿意授权提供自己的数据吗?用户能从数据流通中得到什么呢?

 

对此,区块链提供了一个解决思路,即通过有效度量和激励相容的方式,来提高数据所有者的积极性,从而促进整个社会的数据流动和数据市场的繁荣。

 

首先,要在数据流通场景中提供用户激励,就离不开数据定价问题。在传统市场经济中,价格是由供需关系决定的,那么如何找到数据的需求方和提供方呢?

目前看来可行性比较高的方法,是在数字经济新场景中,引入可信平台,并联合多方共同评估协定。作为数据市场的运营方,可信持牌机构发布数据需求和数据商品,并撮合供需双方,在共同协商的基础上实现多方共赢。通过持牌机构的公信力和号召力,确保整个数据市场经济的合规有序进行。

 

其次,有了供需双方后,还需要对数据进行价值衡量。平台运营方除了撮合供需双方外,还需要对数据获取成本、使用方根据数据产生的收益等进行调研,给出市场指导价格,供需双方可以在此基础上进行浮动,从而形成一个比较稳定合理的价格。

通过区块链上的数据权属记录,以及区块链智能合约,确保数据提供方能够获取到数据价值对应的激励,提高数据提供方对于数据流通的积极性。

 

2020年6月5日,微众银行区块链联合北京绿色交易所、北京绿普惠科技公司共同发布的“绿色出行普惠平台”就是一个很好的案例。

基于绿色碳交易积分区块链,平台经过授权后可通过车联网设备采集车主用户的车辆停驶情况,记录在链上并量化成数字积分(如碳减排量、碳积分等),形成各平台机构共同维护的用户绿色出行记录。

企业可出资购买数字积分,用户亦可使用数字积分兑换相应价值的产品或服务,平台通过精神与物质双重奖励,联合企业与民众共同参与绿色出行项目,促进停驶减排真正落地。在这个案例中,通过激励相容、多方共赢,使得各参与方既承担责任,也有所收获,无论是用户还是政府、出资企业,都能在平台中实现个体价值和整体价值,从而实现了数据的高效流通。

绿色出行普惠平台 

  最后

需要强调的是,本文所阐述的,是一种数据流通的基础设施构建方式,提供用户确权、隐私保护能力,并通过可靠的授权机制和合理的激励机制,提高用户和数据提供方的参与积极性,用户不仅可以授权、愿意授权,而且可以清晰地知晓授权对象、授权数据内容、授权时间、数据用途、自己对数据质量的承诺和义务等。

我们所倡导的,是让数据回归主体,以用户为中心推动实体经济和数字经济融合发展,让各个参与方都付出一定的资源和能力,也获得相应的收获和权利,实现多方价值共赢,实现生态可持续运转。

 

数据流通是数据要素发展的一个必备条件,虽然存在着很多挑战和不确定性,但在利好的政策环境和巨大的市场潜力驱动下,我们对其不可限量的前景深信不疑,相信在行业的共同努力下,数据要素市场将迎来更快更好的发展。

最新回复(0)