保护大模型隐私安全，摩斯获NeurIPS顶会“2024大模型隐私挑战赛赛道冠军”

蚂蚁摩斯隐私计算论坛 2024-11-28 10:57:10

开篇

近日，第三十八届神经信息处理系统年会（NeurIPS 2024）特设官方赛——大语言模型隐私挑战赛（LLM-PC）落幕。摩斯联合浙江大学计算机体系结构实验室陈文智、魏成坤团队共9人组成了“Morse & ARCLab”参赛队伍，荣获该赛事全部两个赛道中攻击赛道的冠军和防御赛道的最佳实用防御奖。赛题聚焦大语言模型训练数据的隐私安全，有助于推动整个领域向构建更加安全、可靠的AI系统目标前进，冠军方案也代表着当前业界领先技术。

赛事信息

NeurIPS是机器学习领域三大顶级国际会议之一，也是中国计算机学会A类推荐会议。本次特设竞赛于2024年7月底开始，由加州大学伯克利分校、德州大学奥斯汀分校、伊利诺伊大学厄巴纳-香槟分校、新加坡国立大学、Center for AI Safety等高校与机构联合命题组织，吸引来自数十个国家超30支队伍参与角逐。本次参赛者的任务是设计与实现创新解决方案，从下游模型中窃取训练数据中的隐私或设计隐私保护的训练方法。

赛题方案介绍

在攻击赛道中，我们通过查询目标模型来构建提示语，促使其为每个掩盖的个人可识别信息（PII）生成候选回应，并计算其损失值，再用自我提示候选提取和基于损失的贪心搜索，选择损失值最低的候选作为最终输出。这种基于分段与聚合的损失计算方法，以加速候选项的选择过程。我们的方法在比赛提供的Llama3.1-8B模型上可以达到0.233的攻击成功率

在防御赛道中，我们利用数据脱敏与合成技术，对包含PII的语料进行随机替换，之后以自回归的方式微调目标模型，可以扰乱大模型对PII信息的记忆，降低其输出正确PII的可能，防止隐私数据泄漏。该方案使主办方提供的攻击方法成功率相对降低30.6%，同时在MMLU和TruthfulQA等基准数据集上的结果也表明该方法对模型性能几乎没有损耗。

产业应用

解决数据和模型的隐私安全问题，是大模型在产业界尤其是金融行业落地的重要课题。结合比赛同款方案，摩斯研发了大模型隐私保护产品，该产品融合数据脱敏、拆分学习、模型混淆、差分隐私、TEE等多种技术路线，实现大模型落地应用中的模型微调、推理全链路数据和模型隐私保护。

在行业应用方面，摩斯大模型隐私保护产品已在银行、证券等多个行业落地推进中。目前已应用在网商银行农业助贷场景，利用摩斯的大模型隐私保护技术融合多方时空大数据，共建“密态时空大模型”，进行行内农户贷款风险评估，进一步提升种植户金融放款效率和满意度。

持续技术创新，摩斯仍在加速！

欢迎与行业伙伴进行业务共创、产业落地合作！

关注我，获取更多资讯~

...全文

561 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

第三十八届NeurIPS 2024大语言模型隐私挑战赛落幕，蚂蚁数科旗下摩斯联合浙大团队获攻击赛道冠军和防御赛道最佳实用防御奖。赛题聚焦大模型训练数据隐私安全，蚂蚁数科摩斯结合方案研发隐私保护产品，已应用于网商银行场景。

源码直接下载地址： https://pan.quark.cn/s/a4b39357ea24 ### Home Bus 协议概述 Home Bus协议，亦被称为家庭总线协议，是由日本研发的一种专门应用于家庭自动化领域的通信标准。该协议在商用空调及其他家用电器的远程操控方面具备广泛的应用范围。借助Home Bus协议，设备之间能够达成高效的通信，使用户能够更加便利地监管家庭中的各类智能设备。 ### ECHONET协议及其背景 Home Bus协议与ECHONET协议存在紧密的联系，实际上，ECHONET代表了一种更为具体的技术规范，其目的在于为家庭自动化领域构建一个开放且统一的通信标准。ECHONET由ECHONET财团负责维护与支持，该组织致力于推动该协议的进步与标准化进程。ECHONET协议的应用范围不仅限于家庭环境，还包括了楼宇自动化以及工业自动化等多个领域。 #### ECHONET的历史版本及修订记录 - **Version 1.0**：发布于2000年3月18日，同年7月对联盟成员公开，最终于同年对公众发布。 - **Version 1.01**：在2001年5月23日，向联盟成员发布，主要进行了补充和勘误工作。 - **Version 2.00**：2001年8月7日，针对联盟成员发布。此版本中将电源线A和电源线B两种方式合并为单一电源线方式（基于电源线A），并对相关描述进行了调整。 - **Version 2.01**：2001年11月9日，进行了一些必要的修正，包括排版错误的修正、术语的标准化等。 - **Version 2.10**：经历预览版和草案阶段后，于2002年3月7日正式对联盟成员开放。此次更新主要涉及第3部分关于状态转换的描述修改。 -...

标题：Java微服务如何拆解注册发现治理内容概要：围绕缓存策略、任务调度、回压控制和审计追踪，拆解Java微服务如何拆解注册发现治理的实现细节。 24直播网：www.hhblgzp.com 24直播网：hgwsty.com 直播下载：eredivisie.hhhtrcw.org.cn 24直播网：sjbfootball.hgyhcygzx.com 直播下载：hikeform.com

源码直接下载地址： https://pan.quark.cn/s/a4b39357ea24 依据所提供的文档材料，可以归纳出以下核心知识点： 1. **TM1668控制器**：TM1668属于一种专为驱动LED显示屏设计的专用驱动集成电路，其特别适用于驱动数码管，能够达成多路LED的驱动与控制，从而提升了显示的效率。 2. **程序简化与时序控制**：程序完成了对TM1668芯片的操作，其功能已经达到最简化程度，且时序设置正确无误。在编程过程中，确保时序的准确性至关重要，因为它直接关联到设备能否正常运作。 3. **寄存器操作**：在编程实践中，运用了 uchar、int 等数据类型来表示数据及控制位。uchar或许是一种8位无符号字符类型，用于存储数据信息。同时，还涉及到对特定位的操作，比如 & 、 >> 等，这些操作用于设定或检测数据位的状态。 4. **硬件控制位**：在代码中，设定了用于控制TM1668的硬件控制位，涵盖 STB（片选信号）、CLK（时钟信号）以及 DIO（数据输入输出信号）。这些控制位的作用在于向TM1668发送指令与数据信息。 5. **数码管显示控制**：借助一系列的 send_data 函数调用，向TM1668发送控制指令与数据，以此来调控数码管的显示状态。例如，设定显示位、挑选显示地址、将数据传输至特定的数码管显示单元等。 6. **定时器中断**：在程序设计中，应用了定时器中断（INT0_timer）来周期性地执行任务。通过设定定时器的初始值（TH0和TL0），定时器在倒计时完成后会触发中断，使得程序能够以固定的频率更新数码管的显示内容。 7. **中断服务程序**：设定了一个中断服务程序，在定时器中断发生时被调用。在中断服务程序...

21,500

社区成员

41,617

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章