文章阅读页通栏

数据隐私保护机制+区块链应用场景大盘点

来源: 万向区块链 作者:万向区块链蜂巢学院公开课
本文为万向区块链蜂巢学院公开课第六课上的课程内容。导师谢红军(矩阵元首席运营官)在区块链和密码学技术研究方面有着丰富经验。在课堂上,他首......
本文为万向区块链蜂巢学院公开课第六课上的课程内容。导师谢红军(矩阵元首席运营官)在区块链和密码学技术研究方面有着丰富经验。在课堂上,他首先带大家回顾了区块链技术是什么,又分析了区块链在十多个领域内的应用,最后有分享了两个他们正在探索的隐私计算案例。

万向区块链蜂巢学院公开课,每周四晚上七点,都将在位于上海虹口区塘沽路463号的虹口科技金融大厦19层金融极客工场准时开课。面向零基础,收取零费用,行业一线大咖亲自授课。万向区块链实验室负责人杜宇在第一课上给大家介绍了区块链基础知识及行业发展;新链空间负责人郝玉琨在第二课详细讲解了区块链最经常出现的10个关键词;第三课上,趣派科技CTO吴为龙为大家介绍了区块链最广为人知的应用:比特币;第四课万向区块链&PlatON首席经济学家邹传伟博士详细介绍了全球稳定币与央行数字货币。11月28日区块链行业的知名创业者和投资者——“暴走恭亲王”龚鸣作为第五课的讲师,以现代计算机、密码学&区块链历史上十几位重要传奇人物为线索,从他们的故事,为大家介绍了区块链技术的演进之路。

欢迎所有对区块链有兴趣的人群参加。请大家继续关注本公众号,了解后续课程及报名方式。

以下内容整理自现场速记稿,有部分不影响原意的删减:

谢红军老师
大家好!很高兴与大家分享我个人和矩阵元在区块链和密码学技术研究方面的一些认识,以及相关应用案例。今晚我们一起来探讨下区块链到底会产生怎样的价值,在哪些领域可以落地,以及它是不是真的能快速落地。

数字时代,数据作为新型生产要素,业已成为企业和国家具有战略意义的核心资产,数据共享和流通已成为刚性需求,然而,数据的隐私保护和数据高效流动间的矛盾,却日益凸显,这在很大程度上,制约着数据的价值兑现。能否有一种技术,完美回答和解决上述问题。现在看来,区块链技术、密码学技术就显得非常重要而必要。

今天我的分享分为三部分:

第一部分我会和大家一起回顾下区块链技术到底是什么;
第二部分将分享区块链技术在各行业的应用;
第三部分将分享两个隐私计算案例。

复习:区块链技术是什么?

区块链技术起源于化名为中本聪(Satoshi Nakamoto)的技术极客在2008年发表的奠基性论文《比特币:一种点对点电子现金系统》,上图就是比特币白皮书。到2009年1月,比特网络上线运行,这标志着全球第一个区块链网络的诞生。

那么,到底什么是区块链?简单地讲,区块链就是一种链式数据结构。利用块链式数据结构来验证与存储数据,利用分布式节点共识算法来生成和更新数据,利用密码学的方式保证数据传输和访问的隐私和安全,利用由自动化脚本代码组成的智能合约来编程和操作数据。

要真正理解比特币,首先要了解下面四个概念:

1、Peer to Peer(P2P)

又称“对等网络”。这个和金融的P2P是两件事,它是指点对点分布式网络的特征。在比特币网络里,没有哪个节点是中心化的,没有哪个节点是不可或缺的,参与共识的节点其角色相互对等,每个节点都存储着完全相同的公共账本,这就叫去中心化的Peer to Peer网络。

举一个例子,大家去医院看病,需要使用现金或者扫码、刷卡挂号,看完病以后医生会说做什么检查,再返回窗口排队付费,之后再检查,检查完以后拿上检查结果排队找医生再看。实际上这里面的所有过程都是支付的过程,每个人的医保卡里都有“巨额资金”,是积累了很多年的“沉睡的钱”。医保卡里的钱和人民币的现有支付系统没有打通,不能快速的实现在线支付,造成了反复排队。这些流程性的东西因为支付不能打通,所以点对点不能实现。

2、Hash

又称“哈希”、“数据散列”、“数据指纹”。哈希就是数据指纹,计算数据指纹的函数就是哈希函数,它可以把任意长度输入数据加工成一个固定长度的输出数据,这个输出数据就是哈希值。一个良好的哈希算法有两个特性:一个是“雪崩效应”,一个是“不可逆”。雪崩效应是指输入数据任何的微小变化都会引起其哈希值的巨大变化,不可逆是指在现在使用现在的计算机技术在现有的数学算法上无法根据哈希值反推出输入数据。

3、Blockchain

我们来看这两个区块,每个区块的内部,主要包含了在当前区块中,达成共识的交易和区块哈希,以及父区块的哈希。区块正是通过父区块的哈希链起来,形成一个单向链。这就是区块链。

可以把Blockchain分开看,Block就是区块,里面记录了交易信息、这个块本身的哈希信息、以及上一个区块的信息,通过上一个区块的哈希值把所有块链接起来变成块链式结构,就是所谓的Blockchain。

4、Proof of Work(PoW)

俗称挖矿。区块链中新区块的生成意味着其中某个节点获得此区块的记账权。而获得记账权的过程即为“挖矿”,它通过节点自身的算力资源以哈希碰撞的方式来解决预先所设定的一道数学难题。成功解决,即挖矿成功,而率先成功的节点也会被系统返还一定的价值回报(比特币现在的回报是12.5个)。系统以此方式,来激励网络中所有节点来参与挖矿过程。

区块链网络另一个典型代表是以太坊。以太坊是由Vitalik Buterin受比特币启发后,提出的一个开源的具有智能合约功能的开放区块链平台。比特币虽然是最早提出的区块链技术,但比特币网络不足以构建更高级的应用。以太坊从设计上主要是为了解决比特币生态扩展性不足的问题。以太坊通过以太坊虚拟机(EVM),来运行部署在以太坊区块链上的智能合约。

根据工信部电子标准化院《区块链 参考架构》,区块链分为公有链、联盟链和私有链。

比特币、以太坊都是公有链,但在现阶段企业级落地、进行实体对接的主要是联盟链。联盟链相比公链,存在两个重要区别点:一般并无密码货币,以及节点准入机制。在联盟链中,一般不存在密码货币,并且要成为联盟链系统中的节点,必须经由系统中承担管理员角色的管理节点进行审核,通过后才能加入此联盟链网络。从应用场景角度上来说,联盟链更具优势,适合企业间应用。

2015年9月,美国科技公司R3CEV联合包括摩根士丹利、高盛、汇丰在内的40多家全球知名银行,共同成立了一个企业区块链联盟——R3 Corda,即为区块链世界中第一个对外公布的联盟链。同年12 月,Linux基金会也主导发起了另一个联盟链项目-Hyperledger,已吸引了IBM、Intel、JP Morgen、富国银行、华为、百度等科技金融企业的加入。国内较有影响的是BCOS和基于隐私计算的PlatONE。

BCOS是万向区块链、矩阵元、微众银行联合打造的。PlatONE是万向区块链和矩阵元基于数据隐私保护叠加自己的核心技术做的联盟链,特色优势就是隐私保护。PlatONE的优势主要有:(1)支持多语言的Wasm虚拟机;(2)高度优化的BFT共识算法;(3)企业级部署与运维工具集;(4)合约管理与升级。原生区块链不支持隐私保护,透明的分布式系统怎么保护隐私?因此必须叠加密码学。PlatONE已在GitHub开源,在官网可以找到白皮书和代码下载地址:https://platone.wxblockchain.com/

区块链技术目前的发展中也存在一些挑战:区块链技术创新日趋活跃;仍在场景尝试,落地应用少;基础设施不够完善;效率和安全性低;法律法规和技术标准仍不完善。

但它未来的发展趋势一定是“技术融合”。云计算提供基础设施,IOT主要解决了信息的采集和感知问题,区块链主要解决了信息的可信传递问题,大数据提供数据的安全保护及资源提供,人工智能则主要解决了信息的智能化处理问题。

举个例子,这么多大数据为什么仍然面临没有满足训练的数据?一是因为别人不愿意分享数据,怕数据泄漏。数据的拥有方往往是大型机构或政府部门,当然互联网平台和厂商里有大量的数据,大家都不会彼此分享;二是如果我分享了数据,我不知道你到底用在哪里用了多少次。因此,数据流动和交易的意愿特别低。区块链能解决数据可信传输的渠道,包括交易、清结算,未来区块链都能做。

最后总结一下,区块链是一种基于密码学技术的分布式系统。区块链技术是下一代计算架构当中的重要组成部分,是类似于分布式网络操作系统级别的计算架构基础设施,也可以理解为“超级数据总线”来实现未来多源异构数据的互操作问题,同时支持基于可证明密码学和复杂计算理论的隐私保护。

区块链在各行业的应用

这是国外报道的Facebook对数据的收集。目前世界上的互联网公司都是这样收集数据的,Facebook和Google的年报里,广告收入占比超过90%,靠的是背后的数据来支撑商业模式。

2018年5月25日,欧洲联盟出台《通用数据保护条例》(GDPR),针对的是对隐私泄露的监管和处罚。在今年10月份的乌镇互联网大会上,司法部副部长赵大程介绍《隐私保护法》正式列入了十三届全国人大的立法规划,一旦进入立法的话一定有监管、监督、处罚的措施,这就要求互联网企业尽快完成对数据隐私保护的改革,必须确保在合法数据获取、使用、保存的情况下进行使用。

前面讲的是个人隐私数据,我们来看一下大数据。前几年全国各地的大数据交易中心蜂拥而起,但是大数据交易中心的业务却不多。为什么呢?因为大数据交易面临着这些问题:数据流通与可交易的范围界定,数据所有权界定,数据的质量评估与定价,数据质量评估,数据定价,数据安全,数据交易标准与立法。

现在互联网服务大部分都是免费的,为什么他们愿意免费提供服务呢?因为他们收集使用者的一些信息。以便利、免费的服务换取隐私数据,这就是交易,否则天下没有免费的午餐。

有没有办法把数据隐私保护起来,并把数据产生的价值分享起来?不管你是交易还是流通、计算,产生的价值都要分给数据生产者。

出于数据泄露及自身利益考虑,掌握大量数据的机构和主体不愿开放自己的内部数据,尤其是重要数据。任何单一机构永远都只能掌握数据全集的一部分,只有将多方数据协同计算才能实现数据价值的最大化。

《中国区块链技术和应用发展白皮书(2016)》里介绍区块链到底能做什么,区块链能做的很多,我们一起来看几个案例。

1、数据可信记录与认证

从数据视角看一下,区块链在密码学和隐私保护情况下能做什么?

数据记录:数据信息、文件材料、图片记录等信息皆可在区块链上进行记录与存储,并保留在各用户账户地址中,区块链上存储信息可通过哈希值进行存证。
数据认证:链上记录的信息可通过其他参与方对数据进行签名确认的方式,进一步提高数据可信度。
数据验证:可通过对哈希值的验证匹配,实现信息篡改的快速识别。

2、数据安全共享和追溯

区块链多节点特性可保证多方间的数据实时共享;并且可按用户、业务、交易对象等不同层次实现数据和账户的隐私保护设置;基于链上数据的记录与认证,可通过智能合约设置,实现按照唯一标识对链上相关数据进行关联,构建数据的可追溯性;用户或需求方可通过DAPP应用直接访问区块链上数据记录,提供数据增信能力。

3、资产确权与数字化流通

通过区块链组建的联盟链可连通核心企业、多级供应商、保理公司、银行、ABS等相关机构,通过在链上登记、确权、资产数字化操作,将链上资产的发行、流通、拆分、兑付等操作进行实时同步,使各关联方间的信息更加对称。由技术不可篡改和不可抵赖性建立起的互信机制,可以打通供应链金融中的信任传导通道,将原本不可拆分的金融资产(票据)数字化,提升资产流动性,降低中小企业的融资成本。

4、数据协同操作

“MPC(安全多方计算)”是去年和今年特别火的词,区块链+MPC的结合,使原始数据在无需归集与共享的情况下,可实现多节点间的协同计算和数据隐私保护。同时,能够保护数据所有权,解决大数据模式下存在的数据过度采集、 数据隐私保护,以及数据储存单点泄露等问题。

5、数据协同管理

区块链+MPC的运用,还可以有效连接政务各部门间的数据孤岛现共享或归集难题,在数据不做归集,数据存储不发生迁移的情况下,为企业提供数据信息或事物办理的协同操作能力;解决政务信息共享“最后一公里”,改善降低企业办事多头跑、重复提交材料的现状。

6、区块链与存证和溯源

这个在网上能搜到很多案例。在数据登记环节,基于区块链技术记录产品生产各环节信息,形成数码数据、环节生产数据、流通数据、消费查询数据的全方位信息档案同步和管理,并且支持扫描设备读取信息后直接加签上链,确保一手信息来源。在信息查询与验证阶段,用户可自主选择联盟节点进行信息查询,数据处理逻辑是通过智能合约维护,为用户提供原始数据验证渠道。

举一个存证的案例,北京互联网法院在最近接入了“天平链”,电子证据即时上链,安全保密、难以篡改;法院全程记录、全程可控,电子证据采信率高;而且多家平台规范取证,流程简便,费用低。

7、区块链与医疗健康

医院的数据基本不会分享给企业,并且监管机构推行分级诊疗,小病小地方看,大病大地方看,很多人吐槽把老百姓选择看病的权利剥夺了。另外,还存在药品追溯体系不健全;病患医疗信息在医院间不互通,重复检查,加重患者负担;纸质票据、处方流通不利于保存、有安全风险等问题。

假如把这些人所有的数据使用区块链共享起来,那么会发生什么呢?

1、结合物联网技术对药品进行实时追踪监管,辅助质量监管,杜绝假药。
2、在确保患者隐私的情况下,实现患者医疗信息脱敏及机构间共享,减少重复检查,提高诊治效率。
3、重要票据和处方上链存证,处方不能被篡改。
4、可信数据存证及智能合约使医疗保险赔付更准确便捷。
5、利用区块链去中心化存储,限制数据的访问权限,以保障就医者的信息、诊断记录、基因数据等医疗信息的安全。

医院的数据和其它机构的结合起来是十分有价值的。举个例子,医院数据通过明文不流通放在本地,提供给药厂进行新药开发,因为可用的数据多了,时效更快了,药企就可以比较快地把新药投放市场,最终药价也会下降,患者看病的负担也会下降。

另外一个例子,慢性病在我们国家造成医院资源浪费的成本增长是不可想象的。我们国家的医疗体系只保障基本的医疗,大量病是无法不管的。保险公司愿意开发慢性病保险,但是他没有数据训练模型,不能准确地开发保险,不能准确地定价保险,不能准确地营销保险。如果他有医院的数据,可以开发一款适合老百姓慢性病(比如高血压)问题的保险,那么老百姓看病的负担就会更轻了。

8、区块链与供应链

供应链就是解决全链条既长又慢又需要大量认证、资格审查才能进行资金的投放、追踪,区块链、密码学就能解决这个问题,把需求流动起来,大家都在一个链上共识可以很快地解决。供应链过程均上链存储,保证全流程可追溯;不可篡改有助于后续对于整个供应链系统的审计;智能合约作为区块链的图灵完备语言,可实现清算逻辑,并能将业务逻辑与清算逻辑融为一体,达到业务完成即清算的效果,可极大降低清算成本;对于供应链系统中的不同相关方,在当需要共同使用由单方面持有的隐私数据时,密码学中的隐私计算技术可实现在不泄露原始数据信息的前提下,对隐私数据进行多方协同分析,解决其中所涉及的隐私问题。

举个例子,万向区块链供应链金融服务平台是万向区块链自主研发,针对供应链链条各角色设计的金融服务平台,旨在以核心企业为中心,以实际贸易背景为基础,根据交易中构成的链条关系和行业特点设定的一种应收账款债权流转融资平台。该平台目前已吸引众多中国优秀企业入驻,并实现降本增效,产业升级;此模式解决了传统制造行业供应链中强势企业占用资金时间长,影响供应链整体协同效率等痛点,最终以提高金融资源在供应链属企业间的配置与效率。据我所知,目前平台上发生的融资金额已经超过2亿人民币了。

9、区块链与身份服务

身份服务,是前段时间我们和医疗保险协会做的,后来发现银行间有黑白名单共享。同一行业里的不同机构有很多联盟,大家又想利用对方的用户信息又不想信息共享。MPC可以很好地解决这种问题,把结果输出给服务提供方,那这一次所有的计算、交易就完成了,你要对查询负责并付出一定的查询费,该费用及时通过系统上的清结算交易。这种解决方案可以扩展到不同行业,医疗行业、保险都可以。

10、区块链与物联网

区块链+物联网可以解决数据所有权问题、数据隐私保护问题、数据可信问题、数据安全共享问题、数据协同计算问题、数据清结算问题等。

11、区块链与能源

分布式能源是很大的区块链解决能解决的问题,未来能源很多,如火电、水电、太阳能等,这些电现在的做法是全部上国家电网。但新能源电不稳定,有风的时候电能很多,没风的时候太阳能电来了,对电网冲击很大。利用区块链技术,实现分布式能源,你家楼顶上的太阳能电,多余的时候可以经过局部社区网络自动卖给其它需要电的邻居,交易完马上结算。这既能减少对国家电网的冲击,也能有效利用能源。

12、区块链与机器学习

区块链能够为机器学习提供合规训练数据和算法,解决数据隐私保护问题、数据清结算问题,实现数据、算法的共享。

区块链不光可以帮着算法寻找可用的数据,还可以帮助算法在平台上进行交易和流通。智能合约可以解决清结算的问题。数据保护的问题解决了,那数据面向算法提供服务的意愿就大。

隐私计算应用案例

1、分布式安防

现在大街上有很多监控设备。如何使用隐私计算、隐私AI技术?首先要在数据采集端做行为数据隐私保护,对监管部门来说当可以实现穿透式。经过采集、监控场所以及安全报警措施系统,更好地基于数据的隐私保护实施分布式安防。

2、医疗影像诊断

有医疗行业从业者问区块链能解决医疗的问题吗?国家对于电子病历的格式和标准都有规定,但实际上医院与医院之间、科室与科室之间、医生与医生之间的电子病例都不一样。这个问题如何解决。影像学也一样,拍的影像如何进行隐私AI智能化识别和辅助诊断?

之前我和一个医院同事聊脸部偏瘫如何远程诊断?有很多脸部偏瘫的人不愿意去医院,这个病会造成心理疾病,不愿出门。但现在有一种技术是远程诊断,摄像头是物联网设备,让你笑,让你嘴向左、向右、向上,或者进行行为训练。但在这一过程中,患者会露出丑态,这对患者来说是种负担,而且对患者的隐私保护也可能做的不到位。如果未来用户隐私AI技术保护了患者的隐私又能进行行为训练,那么就能减轻患者的负担,增加康复的几率。

现代社会产生了大量数据,而且大家对自己隐私数据的保护越来越重视,所以隐私保护技术、隐私计算、隐私AI呼之欲出。对监管者和监督者可以进行一定的数据透明化,但是对商业机构没有义务提供数据。核心就是要解决这几个问题,数据的安全存储、统一的身份认证、隐私保护、数据流通后的价值、进行快速准确无偏袒的清结算。

最后,我想强调一下,所有技术应用逻辑都是数据流动的逻辑和清结算的逻辑,解决这个逻辑就解决了现实社会、实体经济中的流程复杂、分享意愿不坚决问题,才能让区块链服务老百姓、为实体经济造福。谢谢大家!

关键词: 数据隐私  区块链应用场景  
0/300