《隐语入门基础教程》-学习笔记1

线树图集 2025-05-26 11:21:55

一、隐语架构概览

        隐语架构是一个全面且层次分明的隐私保护计算架构,从硬件层到产品层,涵盖了多个关键组件和技术,以满足不同场景下的隐私计算需求。

二、架构分层详解

  • 硬件层 :提供硬件加速和可信环境支持,包括 Intel SGX2、海光 CSV、Intel TDX 等,为整个架构奠定基础,确保计算过程在安全的硬件环境中执行。
  • 资源层 :具备数据管理、网络管理、计算资源管理以及应用管理功能,实现资源的有效分配和管理,以支持上层的隐私计算任务。
  • 计算层 :包含密态引擎和明文引擎。密态引擎如 SPU(Secure Process Unit)利用密码原语(YACL)进行加密计算,而明文引擎则涵盖 PYU 和 SQL,用于处理明文数据的计算任务。
  • 算法层 :支持多种隐私保护原语,如 HEU(同态加密单元)、TEEU(可信执行环境单元)、TECCU(可信计算环境容器单元)、DP(差分隐私)等,还提供混合编译调度功能,以实现不同算法的优化组合和高效执行。
  • 产品层 :提供了丰富的工具和产品,如交互式建模工具 SecretNote、多部署形态的 SecretPad、多方安全数据分析系统 SCQL 等,以满足不同用户群体在各种场景下的隐私保护计算需求。

三、核心组件解析

  • SPU(Secure Process Unit)

    • 定位 :桥接上层算法和底层安全协议,为用户提供个性透明的、高性能的密态计算能力,同时保持原生 AI 框架体验。
    • 核心特性 :原生对接主流 AI 前端(如 TensorFlow、JAX、PyTorch),支持丰富的机器学习算法,采用基于 MLIR 的加密计算编译优化,具备高性能 MPC 协议虚拟机,支持多种数据并行和指令并行优化,适配多种场景的丰富 MPC 协议,并支持协议扩展和异构设备接入。
  • HEU(Homomorphic Encryption Unit)

    • 定位 :作为一个低门槛、高性能的同态加密库,支持多种类型、可扩展的算法协议和硬件加速生态,适用于同态加密相关的需求场景。
    • 核心特性 :支持多种 PHE(部分同态加密)算法,性能在业界领先,提供多种接口(如 Numpy-like API、C++、Python)以方便用户使用,并支持硬件加速以进一步提升性能。
  • TEEU(Trusted Execution Environment Unit)

    • 定位 :支持多种可信执行环境,具备数据使用跨域管控能力,可作为密态计算枢纽,执行数据分析、机器学习、MPC/FL 加速等功能。
    • 功能特点 :实现数据确权、使用授权、使用鉴权、结果授权等功能,支持预处理、经典机器学习,未来计划支持深度学习和大模型,兼容多种硬件环境(如 SGX、HyperEnclave、海光 CSV、Intel TDX)。
  • YACL(Yet Another Common Crypto Library)

    • 定位 :作为多种隐私计算技术路线共用的密码库,注重安全实现保证和高性能。
    • 优势体现 :在安全性方面,具备安全逻辑 “链”;在性能上,核心原语有高性能保障,并有详细的 benchmarking;在易用性上,对密码协议开发者提供了良好的接口抽象,注释即文档。
  • Kuscia(KUbernetes based Secure Collaborative InfrA)

    • 定位 :屏蔽不同机构间基础设施差异,为跨机构协作提供资源管理和任务调度能力。
    • 组成架构 :Master(控制平面)包括 K3s、KusciaControllers 和 InterConnControllers;Lite 包含 ServiceMesh、DataMesh 和 Agent,整体基于 K8s 构建隐私计算任务编排框架。

四、产品功能与应用场景

  • 交互式建模工具(SecretNote) :以 Notebook 形式呈现,支持多节点一站式管理和交互,适用于交互式建模场景,如多方协同进行数据分析、模型训练等,方便用户快速验证 POC,降低终端用户的使用成本和演示成本。
  • 多部署形态产品(SecretPad) :具有轻量化安装、中心模式和计划中的 P2P 模式,可满足不同部署需求和场景,如在中心模式下实现对多个节点的集中管理和协调,在 P2P 模式下实现去中心化的隐私计算协作。
  • 多方安全数据分析(SCQL) :通过提供 MySQL 兼容的 SQL 方言用户界面,让数据分析人员能够在保护数据隐私的前提下,完成多方数据分析任务,适用于多方协作的数据分析场景,如跨机构的数据联合统计、联合查询等。
  • 联邦学习 :包含水平联邦和垂直联邦(主要是拆分学习),在原始数据不出域的情况下,通过交换中间数据完成机器学习建模,适用于对数据隐私要求高且需要利用多方数据进行模型训练的场景,如金融、医疗等领域的联合建模。

五、互联互通与跨域管控

  • 互联互通 :隐语支持与其他厂商的平台进行互联互通,共同完成隐私计算任务。包括黑盒模式(管理调度互联)和白盒模式(基于开放算法协议的互联),满足不同场景下跨平台协作的需求,有助于整合各方资源,拓展隐私计算的应用范围。
  • 跨域管控 :关注数据流转过程中的权益保障,通过数据确权、使用授权、使用鉴权、存证审计等机制,实现数据加工使用权的跨域管控,确保数据在不同域之间的流转符合相关规定和要求,保护数据资源持有者和数据产品的权益。

六、优势总结

  • 分层易集成 :清晰的分层架构使得各层组件相对独立,又相互协作,便于根据实际需求进行灵活集成,无论是平台集成者、算法使用者还是产品使用者,都能找到适合自己需求的组件和接口。
  • 开放的 API 接口 :提供开放的 API 接口,支持二次开发定制,为用户提供了更大的自由度和灵活性,能够满足不同用户的个性化需求,促进隐私计算技术的广泛应用和创新。
  • 大规模生产能力 :具备大规模生产能力,可满足大规模隐私计算任务的需求,保障隐私计算在实际应用中的高效性和可靠性,适合在各种大型项目和场景中落地实施。
...全文
20 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

562

社区成员

发帖
与我相关
我的任务
社区描述
隐语开源社区,隐私计算开发者交流和讨论的平台。
密码学可信计算技术安全 企业社区
社区管理员
  • 隐语SecretFlow
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

【最新活动】

3月18日:隐私计算实训营第一期

试试用AI创作助手写篇文章吧