第三讲:隐私计算框架及技术 笔记

2301_81610385 2024-03-29 16:27:16

一、隐语架构一览

          隐私架构 

 

二、隐语架构拆解 

      定位:通过可视化产品,降低终端用户的体验和演示成本。

                 通过模块化API降低技术集成商的研发成本。

      人群图像----作为隐语的直观入口,隐私保护计算从业者军应该关注

             例如:隐私保护计算集成商、需求方、开发人员、研究人员、产品人员等

 

SecretPad----轻量化安装、快速验证POC、可定制集成

多部署形态----中心模式、P2P模式(计划)

全栈产品----MPC、TEE、SCQL

SecretNote----Notebook形式、交互式建模、多节点一站式管理和交互、运行状态跟踪

 

PSI / PIR

 

       定位:高性能、轻量化、易用的PSI / PIR 专用协议模块

       人物图像:PSI / PIR产品人员、需求人员、研发人员

 

PSI

 

PIR

 

 

Data Analysis

     一种多方安全数据分析系统,可以让互不信任的参与方在保护自己数据隐私的前提下,完成多方数据分析任务

     定位:屏蔽底层安全计算协议的复杂性,以简单熟悉的SQL语言界面,提供多方数据密态分析能力

     人群图像:数据分析集成商、产品人员、需求人员、研发人员

 

Data Analysis----SCQL

Federated Learning  (联邦学习)

     联邦学习

在原始数据不出域的前提下,通过交换中间数据完成机器学习建模。

包含水平联邦和垂直联邦(主要是拆分学习,Split Learning)。

 

定位:具备安全攻防保障的明密文混合机器学习框架

人群图像:深度学习需求方、产品人员、安全AI研究人员

 

安全攻防----安全风险度量体系、攻防框架、攻防算法

性能----稀疏化、量化、流水线、

算法----营销算法(DeepFM、BST、MMoE)、SOTA安全聚合、大模型(计划)

 

混合编译调度 - RayFed

       在Ray基础之上所构建的专注于跨机构的分布式计算调度框架

       https://github.com/ray-project/rayfed      (已成为ray的孵化项目)

       定位:面向跨机构场景,提供单机构内计算任务独立调度和跨机构计算任务协作的能力。

       人群图像:隐语工程开发人员、隐语算法开发人员

 

SPU

     USENIX AT ' 23

     https://www.usenix.org/conferece/atc23/presentation/ma

     定位:桥接上层算法和底层安全协议,保持原生AI框架体验的同时为用户提供透明的、高性能的、基于安全协议的密态计算能力。

    人群图像:机器学习研发人员、密码协议研发人员、编译器研发人员

 

HEU

      定位:低门槛,高性能的同时加密库,支持多类型,可扩展的算法协议和硬件加速生态

     人群图像:同态加密用户、同态算法研究人员、同态硬件研发人员

 

TEEU 

     定位:支持多种可信执行环境的,具备数据使用跨域管控能力的密态计算枢纽,可执行数据分析、机器学习、MPC / FL加速等功能。

     人群图像:数据合规研发人员、TEEU开发人员、TEE硬件制造厂商

 

      跨域管控:数据确权、使用授权、使用鉴权、结果授权

      可信应用:预处理、经典机器学习、深度学习(计划)、大模型(计划)

      多硬件:SGX、HyperEnclave、海光CSV、Intel TDX

 

YACL

     定位:多种隐私计算技术路线共同需要的密码库,具备安全实现保证、高性能等特点。

     人群图像:安全 / 密码研发人员

 

KUSCIA

      定位:屏蔽不同机构间基础设施的差异,为跨机构协议提供丰富且可靠的资源管理和任务调度能力。

      人群图像:隐私保护计算集成商、运维开发人员

 

互联互通

       定位:隐语和其他厂商的平台可以互联互通,共同完成一个隐私计算任务。

       人群图像:互联互通需求方、算法研发人员、平台研发人员、隐私保护计算集成商

 

跨域管控

       定位:数据离开持有者的运维域后,数据方仍然能够有效地控制数据地流程过程,避免其被窃取或者非预期使用。

       人群画像:隐私保护计算需求方、监管方、运维人员

三权分置

       数据要素“三权”在数据流转过程中诞生于流转

       数据要素“三权”权益的机制保障核心是数据加工使用权跨域管控

 

结语:

    隐语----清晰分层,灵活集成,简单易用

产品试用者---->>产品层 / 可视化操作界面---->>通过白屏产品快速了解和一眼隐语能力,并能以较低门槛进行隐私计算的能力演示

平台集成者---->>API / SDK、Kuscia---->>通过集成隐语开源框架及大部分功能进行生产交付,对客提供解决方案

算法使用者---->>FL、SPU、HEU、TEEU---->>自身有隐私计算平台及调度规则,聚集使用隐语AI&BI算法能力来弥补自身能力不足

协议使用者---->>YACL---->>自身有密码基础,通过隐语密码及协议底层能力补充自身产品底层协议,优化已有平台的算法性能

分层易集成、开放的API接口、支持二开定制、大规模生产能力

 

...全文
315 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

571

社区成员

发帖
与我相关
我的任务
社区描述
隐语开源社区,隐私计算开发者交流和讨论的平台。
密码学可信计算技术安全 企业社区
社区管理员
  • 隐语SecretFlow
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

【最新活动】

3月18日:隐私计算实训营第一期

试试用AI创作助手写篇文章吧