隐语可信数据空间MOOC第41讲笔记:跨企业数据查询隐私计算案例

叶开233 2025-12-04 10:08:35

笔记内容来自隐语Mooc,欢迎一起来学习。Mooc课程地址:https://www.secretflow.org.cn/community/bootcamp/2narwgw4ub8rabq/course/vhii941jitkl122?tab=outline

详细案例及代码,可以查看文末的链接。

一、案例背景

  • 场景描述
    • A公司(高科技企业)正在研发新型生物可降解材料,尚未公开或申请专利。
    • A希望向B公司查询该材料是否已存在于B的历史数据库中,以避免重复研发投入。
  • 隐私挑战
    • A不希望B知道自己具体查询哪种材料,否则可能导致:
      • 研发方向与商业战略泄露
      • B恶意抢注相关专利
      • B将查询信息倒卖给第三方
  • 解决方案
    • 使用隐私计算中的匿踪查询技术(PIR),在不泄露查询内容的前提下完成跨企业数据查询。

二、技术简介:PIR(Private Information Retrieval)

  • 定义:一种保护用户查询隐私的技术,允许用户从数据库中查询特定数据,而不让数据库持有方知道用户查询的是哪一项。
  • 分类
    • 按服务器数量
      • 单服务器PIR
      • 多服务器PIR
    • 按查询类型
      • Index PIR:按索引查询,输入索引 i,获取值 V_i
      • Keyword PIR:按关键词查询,输入关键词 K_i,获取值 V_i(本案例采用)

三、数据集与角色

角色文件说明
企业B(server)db.csv模拟数据库,含 keyvalue 两列
server_secret_key.binPIR 中使用的密钥文件
企业A(client)pir_query.csv待查询的记录文件,一列 key,一行取值

四、实验流程(PIR执行步骤)

  1. 环境配置

    • 获取可用端口并配置 ray-fed 环境
    • 再次获取端口并配置 spu 运行环境
  2. Server端初始化

    • Server执行PIR的 setup阶段,准备查询所需的加密结构与密钥
  3. 双方协同查询

    • Client与Server共同执行 online阶段
    • Client获得查询结果,且Server无法得知Client查询的具体内容

五、技术应用价值

  • 实现企业间数据查询的隐私保护,防止查询意图泄露
  • 适用于研发查询、知识产权检索、商业合作调研等敏感场景
  • 推动企业间在保护商业秘密的前提下开展数据协作

六、与前两案例对比

方面新冠重病预测(横向联邦)金融风控建模(纵向联邦)跨企业查询(PIR)
场景医疗联合建模金融风控建模企业数据查询
数据分布样本切分特征切分一方持有数据库,一方发起查询
隐私目标保护样本数据保护特征数据保护查询意图
核心技术横向联邦学习纵向联邦学习匿踪查询(PIR)
适用场景跨机构样本协作建模跨机构特征协作建模隐私保护的数据检索

七、关键启示

  • PIR是隐私计算中查询隐私保护的代表性技术,适用于“查而不露”的场景
  • 在企业合作、研发检索、合规查询等场景中具有重要应用价值
  • 隐私计算技术正逐步形成覆盖联合建模安全查询统计分析等全场景的技术体系

说明:本案例展示了隐私计算在跨企业数据查询中的实际应用,突显了在保护查询方意图的前提下实现安全检索的技术可行性,为企业间敏感数据协作提供了新的解决思路。
隐匿查询案例说明及源码

...全文
109 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
内容概要:本文介绍了浙江蚂蚁密算科技有限公司及其推出的“隐语标准版”隐私计算产品。文章首先阐述了国家对数据要素和数据安全的重视及政策支持,包括一系列法律法规的出台和完善。接着详细介绍了蚂蚁密算科技在隐私计算领域的探索和成就,强调其技术优势和行业影响力。隐语标准版通过端云协同、轻量化部署等方式,实现了数据的安全流通和高效利用,广泛应用于广告营销、保险定价、金融风控、医保理赔等多个领域。此外,产品获得了多项权威认证,并积极参与国内外标准制定。 适合人群:对数据安全和隐私计算感兴趣的从业者、研究者及企业管理者。 使用场景及目标:①广告营销中的精准投放和用户召回;②保险定价中的精算模型构建;③金融风控中的黑名单共享和联合建模;④医保理赔中的智能化审核和DRGs付费体系优化。目标是提升数据流通的安全性和效率,推动各行业的数字化转型。 其他说明:隐语标准版不仅具备高性能和高安全性,还支持多种硬件架构和操作系统,易于部署和使用。蚂蚁密算科技凭借强大的技术研发能力和丰富的实践经验,在隐私计算领域占据领先地位,并致力于构建透明开放的数据流通生态网络。

574

社区成员

发帖
与我相关
我的任务
社区描述
隐语开源社区,隐私计算开发者交流和讨论的平台。
密码学可信计算技术安全 企业社区
社区管理员
  • 隐语SecretFlow
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

【最新活动】

3月18日:隐私计算实训营第一期

试试用AI创作助手写篇文章吧