经常收到一些骚扰电话和垃圾短信,是不是感觉自己的隐私被泄露了?之前我们讲过,大数据时代隐私计算或许是保护隐私最好的工具。那么隐私计算到底是怎么保护隐私的呢?
其实隐私计算是目前大热的技术领域,技术路线多,兼顾数据安全和数据流通,涵盖了密码学、机器学习、硬件等多种学科。简单来说,目前有三大技术发展方向。
第一个就是硬件层面的保护,即可信执行环境,这个技术路线是字面意思的保护,会在计算平台上通过软硬件方法设计出一个安全的计算区域,可以保证在此区域内进行运行的代码及数据的隐私性和完整性。
通过硬件提供物理层面的安全隔离和计算机环境,即使设备底层的基础软件或系统被恶意攻击破坏,也不会影响到数据和代码安全。并且这技术还是通过加密算法来验证和计算隐私数据的,可以通过验证整套代码来确认可信执行环境的安全性,因此也被称为最可信的隐私计算。
第二个技术路线则是在密码学层面进行保护。名为安全多方计算,它的核心原理是进行信息交互的双方找一个公认可信的中间见证人,各方将自己的数据给见证人计算来得出结论。
当然,在现实世界中,隐私数据没办法找到这样理想的见证人,这也曾是安全多方计算的瓶颈。直到提出了混淆电路的方法,将两方参与的安全计算函数编译成布尔电路的形式,并将真值表加密打断,从而实现电路的正常输出,而又不泄露参与计算的双方私有信息。由于任何安全计算函数都可转换成对应布尔电路的形式,所以MPC相较其他的安全计算方法具有更高的通用性。
如今,基于不经意传输、秘密共享等方式,提出了BMR、GMW、BJW、SPDZ等安全多方计算框架,实现了多方联合数据分析、数据安全查询等场景使用。
第三种技术路线名为联邦学习,是数据建模层面的技术,用户只需要将计算的中间结果加密后发送给中心服务器即可完成建模和更新,数据不离开设备本地意味着原始数据所有权被牢牢掌握在使用者手中,这也是最容易理解的隐私计算路线。
技术并没有优劣之分,不同的场景使用不同的技术,隐私计算和可信隐私计算到底有什么区别,对普通人来说几乎感知不到。我们可以知道的是,互联网时代的竞争将是数据的竞争,如今越来越多的隐私计算框架开源,相信未来也会有更多的技术落地应用,期待我们被更好的保护的那一天。