第2讲:匿踪查询(PIR)

Yssbxjd 2024-12-01 22:21:03

匿踪查询(PIR)

 

本讲深入探究了匿踪查询(PIR)技术,为数据查询隐私保护提供关键思路与方法。

一、PIR的定义

PIR 核心在于,服务器持有数据集,客户端发起查询,经 PIR 计算,客户端精准获取查询对应数据,同时确保服务器不知客户端所取数据,客户端亦对无关数据毫无知晓,全方位捍卫隐私。如医疗数据查询场景,患者查询自身记录时,医疗机构无法洞悉查询内容,保障医疗隐私。

 

二、PIR的分类

  • 依据敌手能力分类
    • 信息论安全 PIR:可抵御计算能力无边界敌手攻击,理论安全性极高,为隐私筑牢最强防线。
    • 计算 PIR:针对计算能力受限敌手设计,契合现实多数攻击场景,平衡安全性与效率。
  • 依据服务器数量分类
    • 单服务器 PIR:于现实应用部署更具优势,虽可能需强大如全同态加密(FHE)等密码学原语支撑,但单服务器架构简化管理运维。
    • 双服务器 PIR:运用分布式点函数(DPF)等密码原语效率更佳,然实施难度高,需服务器间严格非共谋且协同,数据存储与管理复杂。
  • 依据查询方式分类
    • 索引 PIR:客户端明确数据存储索引,查询精准直接,适用于已知数据位置情况。
    • 关键字 PIR:客户端依关键字模糊查询,无需知晓数据确切位置,搜索范围广但计算与通信成本或更高,如文献数据库检索。

三、技术方案

平凡方案(基于同态加密算法如 Paillier):实现简易,但通信成本高昂。客户端逐数据加密查询,服务器处理后返回,大量加密解密运算致通信负担剧增,大规模数据查询效率堪忧。

基于同态加密(HE)的 PIR(如 Fan - Vercauteren 方案):服务器将数据库数据转为同态明文,客户端依索引构建加密查询向量,服务器算向量与明文内积,客户端解密得结果。虽功能强大可实现复杂计算,但计算与通信开销大。优化版 SealPIR 采用多数据包组合同态明文、压缩查询向量等策略降成本、提效率,支持多维查询与批量处理,百万级数据查询秒级响应。

 

基于分布式点函数(DPF)的 PIR:DPF 函数特性适配 PIR,双服务器架构下,两函数 DPF.Gen 与 DPF.Eval 协作。数据库复制于非共谋服务器,借 DPF 函数处理实现隐私查询。新 DPF 原语涌现持续优化效率,拓展 PIR 应用场景与规模。

 

...全文
213 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

554

社区成员

发帖
与我相关
我的任务
社区描述
隐语开源社区,隐私计算开发者交流和讨论的平台。
密码学可信计算技术安全 企业社区
社区管理员
  • 隐语SecretFlow
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

【最新活动】

3月18日:隐私计算实训营第一期

试试用AI创作助手写篇文章吧