首批！蚂蚁数科通过中国信通院面向大模型的可信执行环境产品专项测试

蚂蚁摩斯隐私计算论坛 2024-09-06 11:03:54

2024年6月17日，在中国信息通信研究院（以下简称“信通院”）组织的首批“面向大模型的增强型可信执行环境基础能力专项测试”中，蚂蚁数科摩斯顺利完成全部测试内容，成为首批完成此项测试的组织。

标准及测试介绍

《面向大模型训练与推理数据保护的可信执行环境技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会（CCSA TC601），联合30余家企业的专家共同编制，旨在为可信执行环境产品/集群在面向大模型场景时的研发、测试、评估和验收提供参考和指引。

据此标准形成的测试方法覆盖数据工程、模型训练支持、模型推理支持、硬件加速、安全要求五大能力域，包含数据增强、模型管理、环境安全和数据安全等16个子能力域，共计57个测试项。

蚂蚁摩斯大模型隐私保护产品介绍

通用人工智能离不开高质量、大规模数据集，人工智能正在加速从“以模型为中心”向“以数据为中心”转变。当前高质量数据集普遍以孤岛形式存在，为实现可信的多方联合训练与推理，以可信执行环境、联邦学习为代表的隐私计算是可行技术解，但在大模型场景中对其可用与安全性提出更高要求。大模型具有强大的数据挖掘和推理能力，可能会造成用户个人隐私、企业数据资产等敏感信息泄露。

摩斯采用多方安全计算、可信执行环境、差分隐私、联邦大模型拆分和跨域微调、模型混淆、可信硬件等相结合的独创性设计，在原始数据不出域的情况下，实现数据输入、微调、推理全链路数据和模型隐私安全。

软件层面，在原有大模型使用链路上叠加隐私计算能力，进行数据和模型双重保护，并支持大模型隐私微调和安全推理，可实现微调精度损失可控、隐私推理性能提升、密文吞吐量有效提升。支持云部署、一体机、自有算力多种部署方式，实现算力扩展。

硬件层面，蚂蚁摩斯结合适配于可信执行环境的加速硬件，可以实现隐私推理性能和密文吞吐量进一步提升，并主要基于Intel SGX和TDX、AMD SEV、海光CSV、NVIDIA CC等可信计算硬件及蚂蚁自研的机密计算底座构建起可运行大模型的隐私计算系统，满足多场景中的安全性需求。蚂蚁机密计算底座包括开放通用的 TEE 底座 HyperEnclave、易用性高的 TEE 计算引擎 Occlum、可异构互联的 TEE 服务 KuteTEE等，其核心代码通过多项产品认证，为大模型提供全生命周期的安全保护。

应用场景

在金融领域，应用智能化服务工具可进行金融产品分析和推荐，比如针对用户理财投资咨询，可以在不向大模型泄漏用户信息的情况下，通过大模型推理反馈精准、及时的投资建议，对于金融企业，可以预测金融产品的市场表现，同时进行金融舆情分析和客户情绪管理，在节约互动成本的同时可有效改进客户服务和提升用户体验。

在医疗领域，通过应用可信执行环境进行跨机构数据联合建模，可实现隐私保护式的病理研究和智能化辅助快速诊断；在法律领域中，应用可信执行环境进行跨机构的法律模型的联合训练，从而帮助完成法定推理、法律判决、证据发展以及案例结果的预测任务，实现决策效率的有效提升。

未来规划

未来，在持续提升大模型基于可信执行环境的性能、安全和易用性同时，会增加对大模型应用支持和研究降低应用时的安全保护成本，如支持大模型检索增强生成（RAG）和大模型智能体（Agent），让大模型应用在各行各业安全探索和应用；降低大模型安全保护应用门槛，让安全方案的理解、获取、应用和维护成本逐步降低到无感知；打造基于隐私保护技术、高效训练推理技术和可信执行环境等多种安全方案的混合产品能力，为用户在大模型开发和应用等不同阶段提供多种选择和可根据需求和环境进行自动适配的能力。

中国信通院“可信数据流通”评估测试体系自2018年起逐步构建，目前包含隐私计算、使用控制等技术的专项测试，以及数据服务、数据源、公共数据授权运营等服务及合规交易的评估测试。经过6年的发展，“可信数据流通”评估测试体系已成为数据流通领域广受行业认可的第三方评估测试品牌，成为供给侧和需求侧采购选型的风向标。

可信数据流通标准体系

关注我，获取更多资讯~

...全文

66 回复打赏收藏转发到动态举报

写回复

用AI写文章

切换为时间正序

请发表友善的回复…

发表回复

目前，该算法已经融入蚂蚁数科旗下的摩斯大模型隐私保护产品中，并已成为国内首批通过信通院大模型可信执行环境产品专项测试的产品之一。以下是对这篇论文的完整技术解读：论文地址：...

AAAI 2025期间，蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出了一种创新的跨域微调框架ScaleOT，可以实现在模型性能无损的前提下，将模型隐私保护效果提升50%。相比于知识蒸馏技术，还降低了90%的算力...

©作者 |姚凯单位 |蚂蚁摩斯、浙江大学要让大模型适应各不一样的下游任务，微调必不可少。常规的中心化微调过程需要模型和数据存在于同一位置 —— 要么需要数据所有者上传数据（这会威胁到数据所有者的数据隐私），...

提出了一种灵活的方法，可为跨域微调得到多种大小的压缩版模型：提出了一种重要性感知型有损压缩算法 Dynamic LayerReplace，该算法面向使用 LLM 的跨域微调，可通过强化学习和协调器来扩展仿真器。这些组件可以实现...

如下图 2(b) 所示，跨域微调（OT）不是使用完整的模型进行训练，而是允许数据所有者使用模型所有者提供的有损压缩仿真器进行微调，但这种范式有个缺点：会让数据所有者得到的仿真器的性能较差。值得注意的是，该团队...

Menon社区

118,156

社区成员

25,639

社区内容

发帖

与我相关

我的任务

经验分享个人社区浙江省·杭州市

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

社区成员在社区内的言论不得违反国家的法律法规。发帖言论不得含有下列内容：
1、违反宪法确定的基本原则的；
2、危害国家安全，泄露国家秘密，颠覆国家政权，破坏国家统一的；
3、损害国家荣誉和利益的；
4、煽动民族仇恨、民族歧视，破坏民族团结的；
5、破坏国家宗教政策，宣扬邪教和封建迷信的；
6、散布谣言，扰乱社会秩序，破坏社会稳定的；
7、散布淫秽、色情、赌博、暴力、恐怖或者教唆犯罪的；
8、侮辱或者诽谤他人，侵害他人合法权益的；
9、煽动非法集会、结社、游行、示威、聚众扰乱社会秩序的；
10、以非法民间组织名义活动的；
11、含有法律、法规、规章、地方规范性文件、国家政策、政府通知、公序良俗等禁止的内容；
12、本社区认为不利于社区生态、可能给社区造成损失的内容。

试试用AI创作助手写篇文章吧

+ 用AI写文章