[隐语]第三讲 架构详解:"隐语”可信隐私计算开源框架

Chenyang|zhao 2024-12-08 18:56:45

第三讲 架构详解:"隐语”可信隐私计算开源框架

隐语架构

 

1.隐语产品层

 

定位

  • 通过可视化产品,降低终端用户的体验和演示成本。

  • 通过模块化API降低 技术集成商的研发成本

人群画像:隐私保护 计算 集成商、产品人员、隐私保护计算需求方、开发人员、研究人员

SecretPad: 轻量化安装 快速验证POC 可定制集成

全栈产品:MPC TEE SCQL

多部署形态:中心模式 P2P模式(计划)

SecretNote: Notebook形式 交互式建模 多节点一站式 管理和交互 运行状态跟踪

2.算法层

2.1.PSI与PIR

定位:高性能、轻量化、易用的PSI/PIR专用协议模块

人群画像:PSI/PIR 产品人员、需求人员、研发人员

PSI(Private Set Intesection): 一种特殊的安全多方计算(MPC)协议

  • Alice持有集合X,Bob持有集合Y

  • Alice和Bob通过执行PSI协议,得到交集结果X∩Y

  • 除交集外不会泄漏交集外的其它信息

 

 

PIR(Private Information Retrieval) :用户查询服务端数据库中的数据, 但服务端不知道用户查询的是哪些数据

 

2.2.Data Analysis

2.2.1Data Analysis- SCQL

Secure Collaborative Query Language

一种多方安全数据分析系统,可以让互不信任的参与方在保护自己数据隐私的前提下,完成多方数据分析任务

定位:屏蔽底层安全计算协 议的复杂性,以简单 熟悉的SQL 语言界 面,提供多方数据密 态分析能力

人群画像:数据分析集成商、数据分析产品人员、数据分析需求人员、数据分析 研发人员

核心特性:

  • 半诚实安全模型

  • 支持多方(N>=2)

  • 易上手,提供MySQL 兼容的SQL 方言用户界面

  • 支持常用的SQL 语法和算子,满足大部分场景的需求

  • 可实用的性能

  • 提供列级别的数据使用授权控制(CCL)

  • 支持多种密态协议(SEMI2K/CHEETAH/ABY3)

  • 内置支持多种数据源接入(MySQL,Postgres, CSV 等)

 

2.2.2Federated Learning(联邦学习)

在原始数据不出域的前提下,通过交换中间数据完成机器学习建模。 包含水平联邦和垂直联邦(主要是拆分学习,SplitLearning)。

定位:具备安全攻防保障的 明密文混合机器学习框架和算法

人群画像:

深度学习需求方

深度学习产品人员

安全AI研究人员

 

3.计算层

3.1.混合编译调度 - RayFed

在Ray基础之上所构建的专注于跨机构的分布式计算调度框架

https://github.com/ray-project/rayfed (已成为ray的孵化项目)

定位:面向跨机构场景,提供单机构内计算任务独立调度和跨机构计算任务协作的能力。

人群画像:隐语工程开发人员、隐语算法开发人员

(1)SPU SPU全称Secure Process Unit

定位:桥接上层算法和底层安全协议,保持原生AI框架体验的同时为 用户提供透明的、高性能的、基于安全协议的密态计算能力。

人群画像:机器学习研发人员、密码协议研发人员、编译器研发人员

核心特性:

  • 原生对接主流AI前端

  • 持丰富的机器学习算法

  • 带隐私保护语义的中间表示语言

  • 基于MLIR的加密计算编译优化

  • 高性能MPC协议虚拟机

  • 多种数据并行,指令并行优化

  • 丰富的MPC协议,适配各种场景

  • 支持协议扩展,支持异构设备接入

 

(2)HEU HEU全称Homomorphic Encryption Unit

定位:低门槛,高性能的同态加密库,支持多类 型、可扩展的算法协议和硬件加速生态

人群画像:同态加密用户、同态算法研究人员、同态硬件研发人员

核心特性:

  • 支持多种PHE算法

  • 性能业界领先

  • 支持多种接口(Numpy-like API\C++\Python)

  • 硬件加速

 

(3)TEEU TEEU全称Trusted Enextution Environment Unit

定位:支持多种可信执行环境的、具备数据使用跨域管控能力的密态计算枢纽,可执行数据分析、机器学习、 MPC/FL加速等功能。

人群画像:数据合规研究人员、TEE软件开发人员、TEE硬件制造厂商

image-20241208184744708

(4)YACL YACL全称Yet Another Common Crypto Library

定位:多种隐私计算技术路线共同需要的密码库,具备安全实现保 证、高性能等特点

人群画像:安全/密码研究人员

YACL诞生背景:当前学术界密码库存在非标准化实现、缺少长期维护以及性能问题。工业界密码库则缺少良好的密码工具抽象,功能上保守的新协议引入等问题。

 

4.资源层

4.1.kuscia

kuscia全称KUbernetes based Secure Collaborative InfrA

定位:屏蔽不同机构间基础设施的差异,为跨机构协作提供丰富且可靠的资源管理和任务调度能力。

人群画像:运维开发人员、隐私保护计算集成商

 

5.互联互通

定位:隐语和其它厂商的平台可以互联互通,共同完成一个隐私计算 任务。

人群画像:互联互通需求方、算法研发人员、平台研发人员、隐私保护计算集成商

5.1黑盒模式

  • 又称管理调度互联

  • 管理面、控制面实现互联互通

  • 两边加载相同的算法容器

5.2白盒模式

  • 又称基于开放算法协议的互联

  • 算法引擎层面可以直接互联

 

6.跨域管控

定位:数据离开持有者的运维域后,数据方仍然能够有效地控制数据的流转过程,避免其被窃取或者非预期使用。

人群画像:隐私保护计算需求方、监管方、运维人员

数据要素“三权”在数据流转过程中诞生与流转

数据要素“三权”权益的机制保障核心是数据加工使用权跨域管控。

 

03 总结

 

...全文
60 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

551

社区成员

发帖
与我相关
我的任务
社区描述
隐语开源社区,隐私计算开发者交流和讨论的平台。
密码学可信计算技术安全 企业社区
社区管理员
  • 隐语SecretFlow
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

【最新活动】

3月18日:隐私计算实训营第一期

试试用AI创作助手写篇文章吧