隐语可信数据空间MOOC第37讲笔记:数联网与数据空间
叶开233 2025-11-25 16:51:19 笔记内容来自隐语Mooc,欢迎一起来学习。Mooc课程地址:https://www.secretflow.org.cn/community/bootcamp/2narwgw4ub8rabq/course/vhii941jitkl122?tab=outline

📘 数联网与数据空间 学习笔记
一、背景:数字经济发展面临高质量数据危机
1.1 国家政策演进(2020-2025)
| 时间 | 政策/事件 | 意义 |
|---|
| 2020 | 国务院提出加快培育数据要素市场 | 数据成为生产要素 |
| 2022 | “数据二十条”发布 | 搭建数据基础制度体系 |
| 2023 | 国家数据局挂牌 | 专职推动数据产业发展 |
| 2024 | 《数据要素×三年行动计划》 | 推动数据跨领域应用 |
| 2024 | 《可信数据空间发展行动计划》 | 明确数据空间建设路径 |
| 2025 | 《国家数据基础设施建设指引》 | 构建全国一体化数据市场 |
1.2 数据要素的科学原理
第四范式(吉姆·格雷)
- 定义:基于大数据的科学发现模式
- 演进:
- 实验观察
- 理论推演
- 计算模拟
- 数据探索(数据驱动发现)
政治经济学视角
- 数据:生产要素(原材料)
- AI:生产力(认知劳动工具)
- 数据基础设施:生产关系(促进价值释放)
二、数据危机的破解之道:私域数据广域复用
2.1 数联网的内涵
- 定义:由数据复用关系形成的数据语用关系网络
- 类比:类似万维网,但是以数据复用链代替超链接
- 挑战:缺乏有效表征、构造与运行机制,制约复用效率
2.2 数联网的代表性工作
(1)数字对象架构
- 提出者:罗伯特·卡恩(互联网发明人)
- 三要素:标识 + 元数据 + 实体
- 系统:Handle 系统(类DNS的全球数据标识网络)
- 应用:DOI(数字对象标识),如学术论文标识
(2)链接数据架构
- 提出者:蒂姆·伯纳斯·李(万维网发明人)
- 五星部署模型:
- 开放授权
- 机器可读
- 脱离应用
- 全网定位
- 关联发现
三、数联网与数据空间的实践与展望
3.1 数据空间技术与系统全国重点实验室
- 定位:数据领域唯一全国重点实验室
- 使命:打造数据空间与数联网领域的国家战略科技力量
- 重点工程:
- 数据空间融合工程
- 数据资源引接工程
- 可信数据空间发展行动
- 国家数据基础设施建设
3.2 可信数据空间的两类定义
| 类型 | 关注点 | 实现方式 |
|---|
| Trusted Data Space | 可信结果 | 多种技术融合,具备管控、交互、共创能力 |
| Trustworthy Data Space | 可信过程 | 数字合约 + 使用控制,确保“符合预期” |
3.3 数联网基础软件架构
- 全球化数据标识:私域数据广域定位
- 场景化资源调度:私域数据广域交付
- 分布式数据检索:私域数据广域发现
- 标准化访问接口:私域数据广域复用
3.4 典型应用场景
(1)科研数联网
- 目标:提升数据资源发现与复用效率
- 成果:
- 关联论文、数据集、算法
- 支持一键复现实验
- 服务200+科研机构、20万+科研人员
(2)医药数联网
- 目标:提升临床实验数据复用效率
- 成效:
- 降低新药研发数据成本与时间
- 连接药企、医院、监管机构
- 支持真实世界数据研究
四、总结:数联网的核心价值
| 维度 | 贡献 |
|---|
| 数据流通 | 实现私域数据广域可信复用 |
| 技术架构 | 构建基于DOA和链接数据的开放标准 |
| 国家战略 | 支撑全国一体化数据市场建设 |
| 产业发展 | 促进数据要素价值释放与AI生产力提升 |