高手问答第 304 期 —— 聊聊隐私计算技术

小白兔爱吃大灰狼 发布于 2023/08/08 10:29
阅读 11K+
收藏 2
数据流动起来才可以创造更大的价值,随着数字经济持续高速增长, 数据的互联互通需求越来越旺盛,大到政府机关的公共数据、公司核心商业数据、小到个人信息。近两年,我国也相继出台了 《数据安全法》《个人信息保护法》。因此, 如何让数据安全地流通起来,是一个必须要解决的问题
 
隐私计算技术作为 连接数据流通和隐私保护法规的纽带,通过同态加密、混淆电路、差分隐私等技术,实现了 “数据可用不可见”。隐私计算技术是在保护 数据提供方不泄露原始数据的前提下,实现数据分析计算的技术集合。它作为数据流通的 重要创新前沿技术,目前主要包含如下三大技术路线: 安全多方计算(SMPC)、机密计算(TEE)、联邦学习(FL) ,这些技术已经广泛应用于金融、医疗、通信、政务等多个行业。
 
OSCHINA 本期高手问答 (8 月 9 日 - 8 月 15 日) 我们请来了 PrimiHub 开源 和大家一起探讨关于「隐私计算技术」的问题。
 
可讨论的问题包括但不限于:
  • 什么是隐私计算
  • 隐私计算的学习建议
  • 隐私计算相关的技术
  • PrimiHub 的技术设计
如有其他隐私计算相关问题也欢迎积极提问。
 

PrimiHub 作为一款由密码学专家团队打造的开源隐私框架,具有以下特性:
  • 开源:完全开源、免费
  • 自主研发:安全多方计算、联邦学习、同态加密、可信计算等隐私计算技术
  • 开箱即用:拥有 Web 界面、命令行和 Python SDK 等多种使用方式
  • 功能丰富:支持隐匿查询、隐私求交、联合统计、数据资源管理等功能
  • 灵活配置:支持自定义扩展语法、语义、安全协议等
GitHub 地址:https://github.com/primihub/primihub

嘉宾介绍

 
刘仁章,应用数学博士,北京原语科技密码学专家。精通格密码、同态加密、安全多方计算等。在 NIST 全球后量子密码算法竞赛中攻破 HK17 等多个后量子密码候选方案。曾获 2022 年“金融密码杯”竞赛一等奖。
 
为了鼓励踊跃提问, 原语科技 PrimiHub 会在问答结束后从提问者中抽取 5 名幸运会员,赠予 PrimiHub 定制笔记本礼盒 3 件套(内含:笔记本*1、金属签字笔*1、U盘*1)。
 
 

OSChina 高手问答一贯的风格,不欢迎任何与主题无关的讨论和喷子。

下面欢迎大家就 隐私计算技术 相关问题向 PrimiHub 提问,直接回帖提问既可。

加载中
0
小白兔爱吃大灰狼
小白兔爱吃大灰狼

高手问答第 304 期 —— 聊聊隐私计算技术

@before31 @clearsky1991  @梦梦阁  @xiaoaiwhc1  @灰灰

恭喜以上5位网友分别获得 PrimiHub 定制笔记本礼盒 3 件套 一套

请于8月23日前登陆账号, 私信  @小白兔爱吃大灰狼   告知快递信息(格式:姓名+电话+地址),过期视为自动放弃哦~

0
贺小皮蛋
贺小皮蛋

@PrimiHub开源 这块不太熟悉,不过之前看到过类似 同态加密这样的技术介绍,从我们公司的态度来说 企业的数据 基本上都是不对外公开的,如果已经是私域的数据了 是否还会涉及隐私计算这类的场景呢

PrimiHub开源
PrimiHub开源
如提问中所说的,如果是私域数据、没有流通需求的数据,是不需要用到隐私保护技术的。 数据的流通要以隐私保护为前提,隐私计算技术的关键作用就是保护数据流通中的隐私性和安全性。对于企业来说,使用隐私计算技术,可以在不泄漏数据的前提,释放数据的价值。
PrimiHub开源
PrimiHub开源
回复 @PrimiHub开源 : 2020 年 4 月 9 日,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,将数据定义为一种新型生产要素,与土地、劳动力、资本、技术要素并列。而《个人信息保护法》,《数据安全法》等法律法规则进一步规范了数据处理活动,保障数据安全,促进数据开发利用。从数据二十条的提出,数据局的建立,可以看出,国家积极鼓励并大力推进数据要素的高效合规流通。数
0
某人gmgn3
某人gmgn3

@PrimiHub开源 我想问下什么是隐私计算?已将隐私计算的应用途径?

PrimiHub开源
PrimiHub开源
隐私计算是指在「保护数据本身不对外泄露」的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的。隐私计算多应用在金融、医疗、政务、营销等行业,比如「金融领域」的联合反洗钱、银(行)证(券)数据共享、高净值/风险用户共享;「集团机构」间的数据共享比如:共建用户黑名单; 《苹果的差分隐私技术原理》https://my.oschina.net/u/6662337/blog/10087905
0
灰灰
灰灰

是不是可以兼顾隐私,又可以实现计算?不是简单的加/解密。

PrimiHub开源
PrimiHub开源
是的。“隐私计算技术”的全称为“隐私保护计算技术”,是在保护隐私情况下进行计算的技术。仅仅使用普通的加解密功能,达不到隐私计算的要求。有一种特殊的加密技术叫“全同态加密”,可以在密文状态下进行计算,是实现隐私计算的一种技术路线。
0
empireghost
empireghost

@PrimiHub开源   

  • 隐私计算有什么学习建议?  与特定编程语言有关联吗?
  •  
  • 隐私计算有那些相关的技术?  适合什么行业使用?
  •  
PrimiHub开源
PrimiHub开源
隐私计算涉及到的技术有安全多方计算、同态加密、联邦学习、差分隐私、机密计算等,在金融、政务、医疗等行业有很好的应用场景。学习隐私计算技术的话需要有扎实的数学基础,编程语言的话有C++和Python,安全多方计算、同态加密和机密计算多用C++,联邦学习和差分隐私多用Python。
0
Ericpoon
Ericpoon

@PrimiHub开源 这个和使用did做身份认证,有没什么联系?

PrimiHub开源
PrimiHub开源
两者背后用到的一些密码学技术是相同的,如零知识证明等。DID里的认证行为也可以看做是隐私计算在这类特定场景中的应用。目前也有很多区块链+隐私计算的研究。
0
钛元素
钛元素

@PrimiHub开源 请问生产企业内部如何运用隐私计算?我们目前自己写程序中使用密匙对数据加解密是否也算是隐私计算?传输通过密文,到达目的地用私匙解密,安全性也很高吧?是否应用范围不同呢?

PrimiHub开源
PrimiHub开源
对于企业而言,可以通过隐私计算技术,将内部数据与外部数据(这里的外部也可能是企业不同业务部门之间)更好地融合,促进企业降本增效、精准决策。
PrimiHub开源
PrimiHub开源
普通的加密技术不能支持在密文状态下进行一些有意义的计算。但密码学/隐私计算中有一种加密技术叫“全同态加密”,可以支持密文上的计算。其流程是先对数据进行加密,然后其他人可以在密文上进行计算,最后解密得到计算的结果。
PrimiHub开源
PrimiHub开源
单纯的数据加解密不算是隐私计算。加密技术解决的是数据在存储、传输过程中的机密性,不涉及到对数据的计算。另外,目的地对数据解密后就完全得到了数据,而原数据所有者就失去了对数据的绝对控制权。
0
crf1111
crf1111

@PrimiHub开源

你好,对于隐私计算能否列举一下典型的应用场景?以及对计算的效能是否有影响,以及影响的程度如何?

谢谢。

PrimiHub开源
PrimiHub开源
隐私计算会比明文计算速度慢,而且会增加内存使用,可以类比加密通信与明文通信。使用不同的隐私计算技术,其性能的影响是不同的。比如基于MPC的方案通信量较大,基于同态加密的方案运算速度较慢;而且性能和安全级别是相关的,安全级别越高,性能越差。基于TEE的技术性能是最好的,但是需要硬件可信。
PrimiHub开源
PrimiHub开源
隐私计算多应用在金融、医疗、政务、营销等行业,比如「金融领域」的联合反洗钱、银(行)证(券)数据共享、高净值/风险用户共享;「集团机构」间的数据共享比如共建用户黑名单
0
xiaoaiwhc1
xiaoaiwhc1

@PrimiHub开源

您好,之前只是有耳闻隐私计算,现在算是“亲眼所见”了😀。可以介绍一下隐私计算的设计框架吗?另外,我对“可用不可见”比较感兴趣,使用方既然可以使用了,那“不可见”是怎么做到的?或者说哪些是“不可见”的?
多谢解答。

xiaoaiwhc1
xiaoaiwhc1
回复 @PrimiHub开源 : 嗯,有空也一定去看看:smile:
PrimiHub开源
PrimiHub开源
回复 @xiaoaiwhc1 : 类似的还有Shamir秘密分享,虽然只用到了高中数学知识,论文只有两页,但是也非常巧妙,感兴趣的话可以看看。
xiaoaiwhc1
xiaoaiwhc1
回复 @PrimiHub开源 : 网上看了“百万富翁问题”,确实是巧妙的设计:+1:
PrimiHub开源
PrimiHub开源
一个比较有名的例子是“百万富翁问题”,说的是两个人想比较谁更有钱,但是又不想让对方知道自己的财富值。通过隐私计算技术,双方都可以知道谁更有钱,同时不知道对方的财富值。这个例子里面,“对方的财富值”就是“不可见”的,但通过隐私计算技术的确是“可用”的(能够算出比较的结果)。
PrimiHub开源
PrimiHub开源
隐私计算的设计框架可以关注下我们的开源隐私计算平台 PrimiHub。 “可用不可见”是一种形象的说法,指的是使用方能够获得数据计算的结果,但是在计算过程中得不到关于数据的任何信息。这听起来好像有些不可思议,但是的确是可以通过一些技术(如密码技术)手段达到的。
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部