保护大模型隐私安全，摩斯获NeurIPS顶会“2024大模型隐私挑战赛赛道冠军”

蚂蚁摩斯隐私计算论坛 2024-11-29 10:21:05

开篇

近日，第三十八届神经信息处理系统年会（NeurIPS 2024）特设官方赛——大语言模型隐私挑战赛（LLM-PC）落幕。摩斯联合浙江大学计算机体系结构实验室陈文智、魏成坤团队共9人组成了“Morse & ARCLab”参赛队伍，荣获该赛事全部两个赛道中攻击赛道的冠军和防御赛道的最佳实用防御奖。赛题聚焦大语言模型训练数据的隐私安全，有助于推动整个领域向构建更加安全、可靠的AI系统目标前进，冠军方案也代表着当前业界领先技术。

赛事信息

NeurIPS是机器学习领域三大顶级国际会议之一，也是中国计算机学会A类推荐会议。本次特设竞赛于2024年7月底开始，由加州大学伯克利分校、德州大学奥斯汀分校、伊利诺伊大学厄巴纳-香槟分校、新加坡国立大学、Center for AI Safety等高校与机构联合命题组织，吸引来自数十个国家超30支队伍参与角逐。本次参赛者的任务是设计与实现创新解决方案，从下游模型中窃取训练数据中的隐私或设计隐私保护的训练方法。

赛题方案介绍

在攻击赛道中，我们通过查询目标模型来构建提示语，促使其为每个掩盖的个人可识别信息（PII）生成候选回应，并计算其损失值，再用自我提示候选提取和基于损失的贪心搜索，选择损失值最低的候选作为最终输出。这种基于分段与聚合的损失计算方法，以加速候选项的选择过程。我们的方法在比赛提供的Llama3.1-8B模型上可以达到0.233的攻击成功率

在防御赛道中，我们利用数据脱敏与合成技术，对包含PII的语料进行随机替换，之后以自回归的方式微调目标模型，可以扰乱大模型对PII信息的记忆，降低其输出正确PII的可能，防止隐私数据泄漏。该方案使主办方提供的攻击方法成功率相对降低30.6%，同时在MMLU和TruthfulQA等基准数据集上的结果也表明该方法对模型性能几乎没有损耗。

产业应用

解决数据和模型的隐私安全问题，是大模型在产业界尤其是金融行业落地的重要课题。结合比赛同款方案，摩斯研发了大模型隐私保护产品，该产品融合数据脱敏、拆分学习、模型混淆、差分隐私、TEE等多种技术路线，实现大模型落地应用中的模型微调、推理全链路数据和模型隐私保护。

在行业应用方面，摩斯大模型隐私保护产品已在银行、证券等多个行业落地推进中。目前已应用在网商银行农业助贷场景，利用摩斯的大模型隐私保护技术融合多方时空大数据，共建“密态时空大模型”，进行行内农户贷款风险评估，进一步提升种植户金融放款效率和满意度。

持续技术创新，摩斯仍在加速！

欢迎与行业伙伴进行业务共创、产业落地合作！

关注我，获取更多资讯~

...全文

460 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

第三十八届NeurIPS 2024大语言模型隐私挑战赛落幕，蚂蚁数科旗下摩斯联合浙大团队获攻击赛道冠军和防御赛道最佳实用防御奖。赛题聚焦大模型训练数据隐私安全，蚂蚁数科摩斯结合方案研发隐私保护产品，已应用于网商银行场景。

ECR-ECNform_Tx_Blanking_and_SYSCLK_on_Socket1_Key_E_Pinout_2014_10_19.pdf

源码链接： https://pan.quark.cn/s/a4b39357ea24 在C语言编程环境中，多项式求和是一项常见的编程实践，它融合了数学理论、算法设计以及C语言的基础运用。此类程序可能包含对用户输入的多项式表达式进行解析，进而计算各项的总和。接下来将对这一主题进行深入阐述。多项式在数学领域是一个基础性概念，它由常数、变量及指数通过线性方式组合而成，例如表达式`3x^2 + 2x - 1`。在C语言环境下，我们可以借助数组来表示多项式的各项系数，例如通过定义一个整型数组`int coefficients[] = {3, 2, -1}`来保存表达式`3x^2 + 2x - 1`的系数值。 1. **多项式解析**：解析多项式的过程通常需要从用户处获取输入数据，如表达式`3x^2 + 2x - 1`。在C语言中，可以利用`scanf()`函数来接收用户的输入。解析流程涉及到识别每个项的系数、变量及指数，这可能需要运用到字符串处理函数，例如使用`strtok()`函数来分割字符串，以及通过`atoi()`或`atof()`函数将字符串转换为数值类型。 2. **数据结构构建**：为了高效地处理多项式，可以设计一个结构体用以存储每一项的系数和指数信息。例如： ```c typedef struct { int coefficient; int exponent; } Term; ``` 随后，可以选用链表或数组来存储这些结构体实例，以此来完整表示一个多项式。 3. **求和运算**：求和操作可能包含两个阶段：(1) 对相同指数的项进行系数相加，(2) 将计算结果整合至最终的多项式表达式中。在处理同次幂项时，需要遍历两个多项式，识别出具有相同指数的项...

sick镜头的使用说明书

ECN_PCI-X_MMCONFIG_1-7-04.pdf

52,780

社区成员

25,335

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章