隐私计算
  • 推荐0
  • 收藏0
  • 浏览137

隐私计算

陈凯 , 杨强 (作者)  宋亚东 (责任编辑)

  • 丛  书:人工智能前沿技术丛书
  • 书  号:978-7-121-42641-4
  • 出版日期:2022-02-01
  • 页  数:252
  • 开  本:16(170*240)
  • 出版状态:上市销售
  • 维护人:宋亚东
在大数据和人工智能时代,如何在享受新技术带来的便利性的同时保护自己的隐私,是一个重要的问题。本书系统讲解了隐私计算的基础技术和实践案例,全书共有11 章,按层次划分为三部分。第一部分全面系统地阐述隐私加密计算技术,包括秘密共享、同态加密、不经意传输和混淆电路。第二部分介绍隐私保护计算技术,包括差分隐私、可信执行环境和联邦学习。第三部分介绍基于隐私计算技术构建的隐私计算平台和实践案例,隐私计算平台主要包括面向联邦学习的FATE 平台和加密数据库的CryptDB 系统等五个平台,以及隐私计算平台的效率问题和常见的加速策略;实践案例部分主要介绍包括金融营销与风控、广告计费、广告推荐、数据查询、医疗、语音识别及政务等领域的应用案例。此外,本书还展望了隐私计算未来的研究和落地方向。在附录中介绍了当前最新的中国数据保护法律概况。
内容系统完整全面。呈现相对完整的隐私计算知识体系,系统阐述隐私计算关键技术,包括4大发展阶段,5大应用平台,9大落地实践案例。
理论应用价值兼备。系统讲解隐私计算的基础理论和关键技术,包括秘密共享、同态加密、不经意传输、混淆电路、差分隐私、可信执行环境和联邦学习。并介绍了基于隐私计算技术构建的五个前沿隐私计算平台,以及平台的效率问题和常见加速策略。
产业实践案例丰富。本书结合金融营销与风控、广告计费、广告推荐、数据查询、医疗、语音识别及政务等领域的产业应用案例,详细分析了相关技术的适用范围和落地方法,方便读者理解技术的优点和局限性,对实践者具有很高的参考价值。
全新法律法规解读。本书邀请观韬中茂律师事务所的资深律师,对最新的中国数据保护法律进行了详细解读,方便读者了解中国新的数据保护制度。
顶级专家学者力荐。中国科学院院士梅宏倾情作序,中国工程院院士高文,中国工程院外籍院士、加拿大皇家科学院院士罗智泉,创新工场董事长兼CEO李开复联袂推荐。
全彩印刷设计精良。本书采用全彩印刷,精致排版设计,提供上乘阅读体验。
陈 凯
香港科技大学计算机科学与工程系副教授、博导、研究生部主任,智能网络与系统实验室(iSING Lab)主任,香港科大-微信人工智能技术联合实验室(WHAT Lab)主任,香港人工智能与机器人学会(HKSAIR)执行副理事长,香港主题研究计划(Theme-based Reseach Scheme)首席科学家。主要研究方向包括数据中心网络、云计算、大数据和人工智能底层系统和基础架构。担任ACM SIGCOMM、USENIX NSDI、IEEE INFOCOM、IEEE/ACM Transactions on Networking、Big Data、Cloud Computing等国际顶尖会议和期刊的程序委员会委员和编委,亚太网络研讨会(APNet)的发起人和执行委员会主席。陈凯本科和硕士毕业于中国科学技术大学,获得中国科学院院长奖,博士毕业于美国西北大学。

杨 强
加拿大工程院及加拿大皇家科学院两院院士,微众银行首席人工智能官,香港科技大学讲席教授,AAAI 2021大会主席,中国人工智能学会(CAAI)荣誉副理事长,香港人工智能与机器人学会(HKSAIR)理事长以及智能投研技术联盟(ITL)主席。他是AAAI/ACM/CAAI/IEEE/IAPR/AAAS Fellow,也是IEEE Transactions on Big Data和ACM Transactions on Intelligent Systems and Technology创始主编,以及多个国际人工智能和数据挖掘领域杂志编委。曾获2019年度“吴文俊人工智能科学技术奖”杰出贡献奖,2017年ACM SIGKDD杰出服务奖。杨强毕业于北京大学,于1989年在马里兰大学获得计算机博士学位,之后在加拿大滑铁卢大学和Simon Fraser大学任教,他的研究领域包括人工智能、数据挖掘和机器学习等。他曾任华为诺亚方舟实验室主任,第四范式公司联合创始人,香港科技大学计算机与工程系系主任以及国际人工智能联合会(IJCAI)理事会主席。领衔全球迁移学习和联邦学习研究及应用,最近的著作有《迁移学习》、《联邦学习》和《联邦学习实战》等。
前言
身处“数据时代”,如何有效挖掘数据中蕴藏的智能而不侵害数据本身的隐私和安全,是我们推动社会进步和生产力发展需要共同思考和实践的一个课题。隐私计算的本质就是在实现“数据可用不可见”这一目标的过程中产生的一系列理论和技术。
从二十世纪七八十年代诞生的基于隐藏部分信息来保护数据隐私的安全多方计算理论,到近年来围绕“数据不动模型动”理念发明的联邦学习技术,隐私计算的发展已经历40 余年。在这个进程中,产生了大量的理论、算法、协议和技术,例如秘密共享、混淆电路、不经意传输、差分隐私、同态加密和可信执行环境等,也融合了多个学科知识,包括密码学、统计学、人工智能和计算机体系结构等。同时,隐私保护技术近年来也被逐步应用到越来越多的任务(如数据分析、数据库、机器学习)和场景(如金融、医疗、政务)之中,对这些行业的发展起到了一定的积极推动作用。
然而,我们观察到,目前尚未有一本相对全面且系统地介绍隐私计算理论、技术和应用的图书。相关的研究成果和实践经验大多分散在学术论文、会议报告、技术博客和白皮书之中,还未构成一个相对完整的知识体系。这在一定程度上影响
了隐私计算的学科发展和应用普及。我们在与许多老师、同学及相关行业从业者的交流中也有所体会:
• 在一次由中国计算机学会举办的隐私保护机器学习学科前沿讲习班上,我们分享了一个题为《隐私计算理论和效率》的讲座。班上学员大多是来自国内各高校的老师和同学,他们对这个主题非常感兴趣。三个小时的课堂讨论很激烈,课后也有不少学员问了许多问题。从这些提问中我们可以观察到,尽管大家对隐私计算很有热情,但理解还处在相对初级、碎片化的阶段,对隐私计算涵盖的范围、分类相对模糊,对隐私计算各个具体技术的性质、性能、优缺点,以及在实际平台和应用中的使用情况也相对陌生。
• 在推进产学研落地的过程中,我们遇到不少对隐私计算既热情又陌生的群体或机构。香港科学园就有这样的一个例子,他们拥有十几家机构的数据,希望赋能园区内几百家科创企业,但又有泄露数据隐私的担忧。了解到联邦学习能够在保护数据隐私的情况下推进人工智能应用,他们就找到了我,问了许多问题,例如:联邦学习的原理是什么,为什么能保证数据不被泄露,若搭建一个联邦学习平台需要什么样的设备,能支持多少客户,需要多少预算,项目周期大概多久,等等。从聊天中可见,他们对隐私计算很好奇,但充满疑惑。
在国外,有一本叫A Pragmatic Introduction to Secure Multi-Party Computation的书,于今年夏天刚刚被翻译成《实用安全多方计算》引入国内,但该书的内容专注于安全多方计算理论,缺少对联邦学习技术和可信硬件计算技术的阐述和分析,所以还未能构成完整的隐私计算知识体系。此外,该书也没有包含近年来出现的前沿隐私计算平台、隐私保护落地实践案例等,对“产学研”落地的指导意义相对有限。
因此,为构建一个相对完整的隐私计算知识体系,并对其科研落地产生一定的指引,我们编写了这本书。从决定要写到成稿,只用了短短六个多月的时间。香港科技大学智能网络与系统实验室(iSING Lab)的很多同学都参与到了这个过程中,我们阅读整理了大量的研究文献和参考资料,其中也包括一些我们自己发表的相关学术论文,努力用较为通俗易懂的语言讲解隐私计算的基础知识和技术、隐私计算平台、隐私计算落地案例。最后,我们展望了隐私计算的未来,也特别邀请了观韬中茂律师事务所王渝伟和陈刚两位律师帮助解读当前最新的中国数据安全法规,希望对读者有所启发。
如上所述,我们希望通过这部《隐私计算》为学术界和产业界构建一个相对完整的隐私计算知识体系。同时,我们也深知,本书的内容可能并不能包含隐私计算的每个方面,或许与一部“隐私计算全书”还有一定的距离;尽管如此,我们仍希望在这条路上迈出坚实的第一步。

本书主要内容
本书内容大致分为层层递进的三个部分:
第一部分:隐私加密计算技术(第2~5 章)。该部分旨在用通俗的语言介绍各种与隐私加密计算和隐私保护计算相关的各种密码学技术,包括秘密共享、同态加密、不经意传输和混淆电路。这些密码学技术是实现隐私计算的基石。每个章节包含相应的技术基础知识和简单的应用举例。
第二部分:隐私保护计算技术(第6~8 章)。该部分旨在介绍除密码学技术之外的隐私保护计算技术,这部分技术脱离出隐私加密计算的密码学范畴,在更加广泛的技术和应用场景下研究计算过程中对数据隐私的保护、管理与度量的可能性,包括差分隐私、可信执行环境和联邦学习。
第三部分:隐私计算平台和实践案例(第9~10 章)。介绍基于以上隐私计算技术构建的隐私计算平台,主要包括面向联邦学习的FATE 平台和加密数据库的CryptDB 系统等五个平台。同时,也介绍了隐私计算平台的效率问题和常见的加速策略。在实践案例部分,主要介绍包括金融营销与风控、广告计费、广告推荐、数据查询、医疗、语音识别及政务等领域的应用案例。
此外,第11 章展望了隐私计算未来的研究和落地方向。最后,附录中提供了当前最新的中国数据保护法律概况。

致谢
为协助完成本书的撰写,一群非常优秀的博士研究生、学者和工程师付出了大量的时间和精力。在此,我们首先感谢以下参与各章节编写的同学:
• 第2 章:杨柳,柴迪。
• 第3 章:田晗,金逸伦。
• 第4 章、第5 章:任正行,金逸伦。
• 第6 章:金逸伦,田晗。
• 第7 章:张骏雪,任正行。
• 第8 章:金逸伦,任正行。
• 第9 章:程孝典,胡水海。
• 第10 章:柴迪,杨柳,任正行,田晗,郭昆,陈天健。
此外,在编写过程中我们参阅了大量的著作和相关文献,在此对这些著作和文献的作者一并表示感谢。由于水平有限,书中不足及错误之处在所难免,敬请专家和读者给予批评指正。
最后,我们要感谢家人对我们的理解与支持!

陈凯,杨强
2021 年12 月,中国香港

目录

目录

推荐序
前言
数学符号

第1 章隐私计算介绍/1
1.1 隐私计算的定义与背景/2
1.1.1 隐私计算的定义与分类/2
1.1.2 隐私计算的发展历程/6
1.2 隐私计算的技术实现/8
1.3 隐私计算平台与案例/10
1.4 隐私计算的挑战/10


第2 章秘密共享/13
2.1 问题模型及定义/15
2.1.1 秘密共享问题模型/15
2.1.2 秘密共享定义/16
2.2 原理与实现/19
2.2.1 秘密共享方案的发展/19
2.2.2 经典秘密共享方案/21
2.2.3 秘密共享方案的同态特性/26
2.3 优缺点分析/28
2.4 应用场景/28
2.4.1 秘密共享在横向联邦学习中的应用/28
2.4.2 秘密共享在纵向联邦学习中的应用/31
2.4.3 秘密共享在安全多方计算中的应用/32



第3 章同态加密/35
3.1 问题模型及定义/36
3.2 原理与实现/39
3.2.1 群/40
3.2.2 环/41
3.2.3 格/41
3.2.4 部分同态加密/42
3.2.5 近似同态加密/44
3.2.6 全同态加密/45
3.2.7 层级同态加密/48
3.3 优缺点分析/50
3.3.1 同态加密的优点/50
3.3.2 同态加密的缺点/51
3.4 应用场景/52
3.4.1 密文检索/52
3.4.2 云机器学习服务/54



第4 章不经意传输/57
4.1 问题模型及定义/58
4.2 不经意传输的实现/58
4.2.1 基于公钥加密的不经意传输/58
4.2.2 不经意传输的扩展与优化/59
4.3 应用场景/61


第5 章混淆电路/63
5.1 问题模型及定义/64
5.2 混淆电路的实现与优化/65
5.2.1 使用不经意传输的简单实现/66
5.2.2 混淆电路计算与门电路/67
5.2.3 任意逻辑门和电路/67
5.2.4 主流的优化方案和代价分析/69
5.3 优缺点分析/71
5.4 应用场景/72
5.4.1 与其他安全多方计算协议混合使用/72
5.4.2 混淆电路实现一般的安全多方计算/73

第6 章差分隐私/75
6.1 问题模型及定义/7
6.1.1 随机回答的问题模型及定义/77
6.1.2 差分隐私的问题模型及定义/78
6.2 实现方法及性质/83
6.2.1 离散值域:随机回答/83
6.2.2 连续值域:拉普拉斯噪声法和高斯噪声法/83
6.2.3 差分隐私的性质/86
6.3 优缺点分析/88
6.4 应用场景/90
6.4.1 传统数据分析/90
6.4.2 机器学习/92

第7 章可信执行环境/97
7.1 可信执行环境简介/98
7.2 原理与实现/99
7.2.1 ARM TrustZone/99
7.2.2 Intel SGX/101
7.2.3 AMD SEV/102
7.2.4 AEGIS/104
7.2.5 TPM/104
7.3 优缺点分析/104
7.4 应用场景/106
7.4.1 移动终端/106
7.4.2 云计算/108
7.4.3 区块链/110


第8 章联邦学习/111
8.1 联邦学习的背景、定义与分类/112
8.1.1 联邦学习的背景/112
8.1.2 联邦学习的定义/113
8.1.3 联邦学习的分类/113
8.1.4 联邦学习的安全性/115
8.2 横向联邦学习/16
8.2.1 横向联邦学习架构、训练与推理/116
8.2.2 联邦平均算法/117
8.2.3 横向联邦学习的隐私安全性/118
8.3 纵向联邦学习/122
8.3.1 纵向联邦学习架构、训练与推理/122
8.3.2 纵向联邦线性回归/123
8.3.3 纵向联邦学习的隐私安全性/125
8.4 联邦迁移学习/125
8.4.1 迁移学习简介/126
8.4.2 联邦迁移学习算法训练和推理/126
8.4.3 联邦迁移学习的安全性/129
8.5 联邦学习的应用场景/129
8.5.1 自然语言处理/130
8.5.2 医疗/130
8.5.3 金融/131
8.6 联邦学习的未来展望/131
8.6.1 隐私与效率、性能的权衡/132
8.6.2 去中心化的联邦学习/132


第9 章隐私计算平台/135
9.1 隐私计算平台概述/136
9.2 FATE 安全计算平台/136
9.2.1 平台概述/136
9.2.2 FATE 中的隐私计算技术/138
9.2.3 平台工作流程/139
9.2.4 应用场景/141
9.3 CryptDB 加密数据库系统/142
9.3.1 系统概述/142
9.3.2 隐私计算技术在CryptDB 中的实现:基于SQL 感知的加密策略/144
9.3.3 基于密文的查询方法/145
9.3.4 应用场景/147
9.4 MesaTEE 安全计算平台Teaclave/148
9.4.1 飞桨深度学习平台与安全计算/148
9.4.2 PaddleFL 联邦学习框架/149
9.4.3 MesaTEE 平台概述/150
9.4.4 MesaTEE 底层可信执行环境/150
9.4.5 FaaS 服务/152
9.4.6 执行器MesaPy/153
9.4.7 应用场景——MesaTEE 与飞桨/154
9.5 Conclave 查询系统/155
9.5.1 系统概述/155
9.5.2 Conclave 隐私安全技术介绍/156
9.5.3 Conclave 查询编译/158
9.5.4 应用场景/161
9.6 PrivPy 隐私计算平台/161
9.6.1 PrivPy 平台概述/161
9.6.2 平台后端安全计算介绍/163
9.6.3 用户编程接口/165
9.6.4 应用场景/166
9.7 隐私计算平台效率问题和加速策略/166
9.7.1 隐私计算技术中的效率问题/167
9.7.2 异构加速隐私计算/168
9.7.3 网络优化解决数据传输问题/171


第10 章隐私计算案例解析/175
10.1 隐私计算在金融营销与风控中的应用/176
10.2 隐私计算在广告计费中的应用/182
10.3 隐私计算在广告推荐中的应用/185
10.4 隐私计算在数据查询中的应用/187
10.5 隐私计算在医疗领域的应用:基因研究/189
10.6 隐私计算在医疗领域的应用:医药研究/193
10.7 隐私计算在语音识别领域的应用/194
10.8 隐私计算在政务部门的应用/196
10.9 隐私计算在用户数据统计的应用/ 203


第11 章隐私计算未来展望/209

参考文献214


附录A 中国数据保护法律概况/233
A.1 《个人信息保护法》与数据保护/234
A.1.1 适用范围/234
A.1.2 个人信息处理原则/234
A.1.3 个人信息保护影响评估制度/235
A.1.4 禁止“大数据杀熟”的算法歧视/235
A.1.5 个人信息跨境提供规则/236
A.1.6 个人信息主体权利/236
A.2 《数据安全法》与数据保护/ 237
A.2.1 适用范围和域外效力/237
A.2.2 数据分类分级保护制度/237
A.2.3 数据安全保护义务/237
A.3 《网络安全法》与数据保护/ 238

读者评论

同系列书

  • 深入浅出AI算法:基础概览

    吕磊 (作者)

    本书从理论到实践,循序渐进地介绍人工智能算法的基础知识,帮助读者敲开人工智能算法之门。本书共有8 章,分别为算法入门、算法之内力、算法之招式、算法之武功秘籍、算...

    ¥89.00
  • 自然语言处理:基于预训练模型的方法

    车万翔 (作者)

    自然语言处理被誉为“人工智能皇冠上的明珠”。深度学习等技术的引入为自然语言处理技术带来了一场革命,尤其是近年来出现的基于预训练模型的方法,已成为研究自然语言处理...

    ¥118.00
  • 隐私计算

    陈凯 杨强 (作者)

    在大数据和人工智能时代,如何在享受新技术带来的便利性的同时保护自己的隐私,是一个重要的问题。本书系统讲解了隐私计算的基础技术和实践案例,全书共有11 章,按层次...

     

相关图书

可解释人工智能导论

杨强 范力欣 朱军 陈一昕 张拳石 朱松纯 陶大程 崔鹏 周少华 刘琦 黄萱菁 张永锋 (作者)

本书全面介绍可解释人工智能的基础知识、理论方法和行业应用。全书分为三部分,共11 章。第一部分为第1 章,揭示基于数据驱动的人工智能系统决策机制,提出一种基于人...

 

知识图谱与认知智能:基本原理、关键技术、应用场景与解决方案

吴睿 (作者)

认知的高度决定了你创造价值的高度,包括你对世界的认知及世界对你的认知。知识图谱与认知智能技术的发展,既孕育了圈层变更的机会,也带来了人、机器、企业如何协同与博弈...

 

实用推荐系统

Kim Falk (作者) 李源 朱罡罡 温睿 (译者)

要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建...

¥119.00

Kubernetes权威指南:从Docker到Kubernetes实践全接触(第5版)

龚正 吴治辉 闫健勇 (作者)

Kubernetes是由谷歌开源的容器集群管理系统,为容器化应用提供了资源调度、部署运行、服务发现、扩缩容等一整套功能。Kubernetes也是将“一切以服务(...

 

迁移学习导论

王晋东 (作者)

迁移学习作为机器学习和人工智能领域的重要方法,在计算机视觉、自然语言处理、语音识别等领域都得到了广泛的应用。本书的编写目的是帮助迁移学习及机器学习相关领域的初学...

¥109.00

OpenCV 4机器学习算法原理与编程实战

朱斌 (作者)

本书主要面向OpenCV领域的研究与开发人员,采用原理结合实战的方式,介绍OpenCV 4的机器学习算法模块与深度神经网络模块中的核心算法原理与C++编程实战。...