《2025隐私计算实训营|数据要素驱动的隐私计算实践》学习笔记-3
可信隐私计算框架核心模块解析
一、隐语架构体系与分层设计
1. 五层架构模型
- 硬件层:兼容 FPGA/GPU/ASIC 等计算设备,支持海光 CSF、Intel TDX 等可信执行环境(TEE),通过硬件加速与安全特性提升系统性能。
- 资源层:整合数据管理、网络管理、边缘计算管理模块,实现计算资源的统一调度与稳定支撑。
- 计算层:由隐私保护容器、混合编译调度(RayFed)、密态引擎(SPU)构成,负责算法高效执行与任务安全调度。
- 算法层:集成 PSI/PIR、联邦学习、安全多方计算(MPC)等核心算法,支撑数据安全融合与智能建模。
- 产品层:提供 CLI 工具、可视化 DAG 操作界面(SecretPad)、交互式 Notebook(SecretNote)等多形态产品,降低使用门槛。
2. 架构核心优势
- 分层清晰:各层职责隔离,接口标准化,便于开发维护与功能扩展。
- 集成灵活:支持中心式 / P2P 分布式部署,兼容多机构现有系统无缝对接。
- 易用性强:通过可视化工具与模块化 API,降低技术门槛与研发成本。
二、核心产品与工具解析
1. SecretPad:轻量化隐私计算入口
- 特性:支持快速部署验证 POC,提供定制化集成能力,适配企业业务需求。
- 部署模式:当前支持中心模式,计划扩展 P2P 模式以适应分布式网络架构。
2. SecretNote:交互式建模协作平台
- 功能:以 Notebook 形式支持多节点一站式管理,实时跟踪任务状态,提升团队协作效率。
三、隐私计算核心技术解析
1. PSI/PIR:隐私数据交互技术
- PSI(隐私集合求交)
- 原理:安全计算两集合交集,确保非交集元素不泄露(如 Alice 与 Bob 安全交换用户 ID 交集)。
- 协议支持:半诚实模型(ec-dh、kkt16)、恶意模型(mini-psi),支持多方扩展(如 3 方 ecdh 协议)。
- PIR(隐私信息检索)
- 原理:用户查询数据库时隐藏查询内容(如医疗记录检索不暴露查询条目)。
- 协议路线:Sealed PIR、Label PIR,规划支持 Spiral/Simple PIR 协议。
2. SCQL:多方安全数据分析系统
- 定位:基于 SQL 的隐私保护分析工具,支持 N≥2 方半诚实安全计算。
- 核心能力:
- 兼容 MySQL 语法,提供列级数据授权(CCL)。
- 支持 SEMI2K/CHEETAH/ABY3 等密态协议,集成 MySQL/Postgres/CSV 多数据源。
四、联邦学习与密态计算框架
1. 联邦学习技术栈
- 核心模式:水平联邦、垂直联邦(拆分学习),原始数据不出域,交换中间参数建模。
- 安全特性:构建风险度量体系,集成攻防算法抵御攻击,支持 DeepFM/BST 等营销算法与大模型(规划中)。
2. RayFed:跨机构调度引擎
- 定位:基于 Ray 的分布式调度框架,支持单机构内任务独立调度与跨机构协作。
- 应用场景:跨企业数据分析、联合建模,提升资源利用率与任务执行效率。
3. SPU:密态计算引擎
- 能力:桥接 AI 框架(TensorFlow/PyTorch)与安全协议,支持 MLIR 编译优化与高性能 MPC 协议虚拟机。
- 架构:Frontend 接收模型输入,Compiler 生成隐私保护中间表示,Runtime 执行密态计算任务。
五、密码学与硬件加速组件
1. HEU:同态加密库
- 定位:低门槛高性能同态加密方案,支持 PHE/LHE/FHE 多类型算法。
- 特性:兼容 Numpy/C++/Python 接口,集成硬件加速(如 GPU)提升加密计算效率。
2. TEEU:可信执行环境枢纽
- 功能:跨域管控数据使用(确权、授权、鉴权),支持 SGX/TDX 等 TEE 硬件,规划扩展深度学习与大模型应用。
3. YACL:隐私计算密码库
- 优势:相比 EMP/OpenSSL,在性能、安全性、易用性间实现平衡,为 MPC/FL 等提供底层密码学支撑。
六、跨机构协作与数据治理
1. KUSCIA:跨域资源调度平台
- 架构:
- 控制平面:K3s 轻量级 K8s + 自定义控制器(任务调度、服务发现)。
- 数据平面:ServiceMesh(通信)+DataMesh(数据管理)+Agent(节点管理)。
2. 互联互通机制
- 黑盒模式:通过管理面实现跨平台任务调度,需统一算法容器。
- 白盒模式:基于开放协议实现引擎层互联,支持更深度协作。
3. 三权分置管控
- 核心理念:基于数据持有权、加工权、经营权分置,通过确权、授权、审计技术保障数据跨域合规流转,构建密态互联网(存储 + 通信加密)。
七、学习总结与技术价值
隐语体系通过 “硬件 - 算法 - 产品” 全栈技术链,构建了安全、高效、易用的隐私计算生态。关键收获包括:
- 掌握 SecretPad 轻量化部署、SCQL 隐私分析、RayFed 跨域调度等工具实操。
- 深入理解 PSI/PIR 协议原理、联邦学习安全机制、SPU 与 AI 框架的融合逻辑。
- 认识到 “三权分置” 技术对数据要素合规流通的支撑作用,为数据安全共享与价值释放提供了可行路径。