隐语可信数据空间MOOC第39讲笔记：新冠重病预测隐私计算案例

叶开233 2025-12-04 09:42:08

笔记内容来自隐语Mooc，欢迎一起来学习。Mooc课程地址：https://www.secretflow.org.cn/community/bootcamp/2narwgw4ub8rabq/course/vhii941jitkl122?tab=outline

详细案例及代码，可以查看文末的链接。

学习笔记：新冠重病预测隐私计算案例

一、工具介绍：SecretNote

定位：专为隐语学习和隐私计算开发者设计的高级工具套件，以Notebook形式呈现。
功能特点：
- 支持多节点代码自动执行，支持多方代码编写与运行。
- 提供类似Jupyter Notebook的交互式文件管理体验。
- 支持代码运行状态追踪，便于调试与监控。
使用方式：可通过Docker启动SecretFlow环境，避免环境配置问题。
适用场景：适用于学习与开发，不建议用于生产环境。

二、案例背景：新冠病毒重病预测

目标：医疗机构A（alice）与医疗机构B（bob）希望联合构建一个预测模型，判断COVID-19患者是否为重症高风险人群，以优化医疗资源分配。
数据来源：Kaggle上的COVID-19数据集，包含1,048,575条样本，本案例选取10,452条进行建模。

三、数据集说明

原始特征（共21个字段）：

DATE_DIED：生存状态（标签，处理后为y）
USMER、MEDICAL_UNIT、SEX、PATIENT_TYPE、INTUBED、PNEUMONIA、AGE、PREGNANT
DIABETES、COPD、ASTHMA、INMSUPR、HIPERTENSION、OTHER_DISEASE、CARDIOVASCULAR、OBESITY、RENAL_CHRONIC、TOBACCO、ICU

数据预处理：

标签构造：将DATE_DIED二值化为y（0=存活，1=死亡）。
数据分割：将10,452条样本水平切分给两个参与方（alice与bob），模拟跨机构数据分布。

四、技术实现要点

建模方式：使用横向联邦学习，确保数据不出本地即可联合建模。
仿真环境：案例中使用SecretFlow仿真模式，模拟三个节点：alice、bob、server。
核心工具：结合SecretNote与SecretFlow实现隐私保护下的机器学习建模。

五、案例总结

本案例展示了隐私计算在医疗联合建模中的实际应用。
通过联邦学习技术，在保护数据隐私的前提下，提升了重症预测的准确性。
为医疗机构间安全数据协作提供了可行方案。

六、资源链接

案例模板：https://studio.secretflow.com/secretnote-case/6r80ic179t163w
SecretFlow文档：https://www.secretflow.org.cn/zh-CN/docs/secretflow/v1.10.0b1
SecretFlow GitHub：https://github.com/secretflow/secretflow
SecretNote GitHub：https://github.com/secretflow/secretnote
在线体验环境：https://studio.secretflow.com/secretnote

说明：本案例为教学演示，重点在于理解隐私计算在医疗数据联合建模中的应用流程与技术实现，实际生产环境中需结合具体业务与合规要求进行调整。

...全文

123 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

内容概要：本文介绍了浙江蚂蚁密算科技有限公司及其推出的“隐语标准版”隐私计算产品。文章首先阐述了国家对数据要素和数据安全的重视及政策支持，包括一系列法律法规的出台和完善。接着详细介绍了蚂蚁密算科技在隐私计算领域的探索和成就，强调其技术优势和行业影响力。隐语标准版通过端云协同、轻量化部署等方式，实现了数据的安全流通和高效利用，广泛应用于广告营销、保险定价、金融风控、医保理赔等多个领域。此外，产品获得了多项权威认证，并积极参与国内外标准制定。适合人群：对数据安全和隐私计算感兴趣的从业者、研究者及企业管理者。使用场景及目标：①广告营销中的精准投放和用户召回；②保险定价中的精算模型构建；③金融风控中的黑名单共享和联合建模；④医保理赔中的智能化审核和DRGs付费体系优化。目标是提升数据流通的安全性和效率，推动各行业的数字化转型。其他说明：隐语标准版不仅具备高性能和高安全性，还支持多种硬件架构和操作系统，易于部署和使用。蚂蚁密算科技凭借强大的技术研发能力和丰富的实践经验，在隐私计算领域占据领先地位，并致力于构建透明开放的数据流通生态网络。

隐语 secretflow 是由蚂蚁发起的隐私计算通用框架，本仓库mirror自github对应仓库，更新时效可能有延时。SecretFlow是一个统一的框架，用于保护隐私的数据智能和机器学习。为了实现这个目标，它提供了以下内容：抽象设备层，包括明文设备和封装了各种密态协议的密态设备。设备流层，将高阶算法转为设备对象流和DAG。算法层，使用水平或垂直分区的数据进行数据分析和机器学习。工作流层，无缝集成数据处理、模型训练和超参调整。Kuscia: 一款基于 K3s 的轻量级隐私计算任务编排框架。SCQL: 允许多个不信任方在不泄露其私人数据的情况下进行联合分析的系统。SPU: 一种可证明、可测量的安全计算设备，在提供计算能力的同时保护您的数据隐私。HEU: 一个高性能的同态加密算法库。YACL: 一个 C++ 库，包含SecretFlow代码所依赖的密码学、网络和io模块。

隐语 secretflow 是由蚂蚁发起的隐私计算通用框架，本仓库mirror自github对应仓库，更新时效可能有延时。

山东大学隐语数据要素大赛COOL队参赛作品CSGO-联邦隐私商业安全保障 CSGO联邦隐私商业安全保障一个基于隐语多方安全隐私计算框架和Tauri框架的分割学习交易风控系统CSGO联邦隐私商业安全保障（Commerce Security & Governance Over Privacy Alliance）基于隐语·SecretFlow隐私计算框架，针对当前“先用后付”“仅退款”等电子商务新场景，通过不同平台间购物者信用限制信息隐私共享，利用分割学习，从而识别不良用户并限额的交易风控系统。目錄环境要求CLI部署综合安装依赖环境调试运行产品启动 Ray 环境初次运行除其他外图形用户界面部署从发布开始来自来源综合安装依赖环境安装所需的包开始构建数据格式csv数据格式原始数据预测训练集数据测试集数据CLI运行项目运行生成文件夹预测GUI运行GUI引导获奖情况本项目在山东大学×蚂蚁集团隐语SecretFlow举办的2024年数据创意流通创意大赛中获得一等奖（第一名）。环境要求GNU/Linux

隐语的MPC SQL数据分析引擎，提供SQL语法的多方安全联合的数据分析能力

隐语开源社区

574

社区成员

2,178

社区内容

发帖

与我相关

我的任务

密码学可信计算技术安全企业社区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

【最新活动】

3月18日：隐私计算实训营第一期

试试用AI创作助手写篇文章吧

+ 用AI写文章