保护大模型隐私安全,摩斯获NeurIPS顶会“2024大模型隐私挑战赛赛道冠军”

蚂蚁摩斯隐私计算论坛 2024-12-12 11:52:53

开篇

近日,第三十八届神经信息处理系统年会(NeurIPS 2024)特设官方赛——大语言模型隐私挑战赛(LLM-PC)落幕。摩斯联合浙江大学计算机体系结构实验室陈文智、魏成坤团队共9人组成了“Morse & ARCLab”参赛队伍,荣获该赛事全部两个赛道中攻击赛道的冠军防御赛道的最佳实用防御奖。赛题聚焦大语言模型训练数据的隐私安全,有助于推动整个领域向构建更加安全、可靠的AI系统目标前进,冠军方案也代表着当前业界领先技术。  

图片

图片

 

赛事信息

NeurIPS是机器学习领域三大顶级国际会议之一,也是中国计算机学会A类推荐会议。本次特设竞赛于2024年7月底开始,由加州大学伯克利分校、德州大学奥斯汀分校、伊利诺伊大学厄巴纳-香槟分校、新加坡国立大学、Center for AI Safety等高校与机构联合命题组织,吸引来自数十个国家超30支队伍参与角逐。本次参赛者的任务是设计与实现创新解决方案,从下游模型中窃取训练数据中的隐私设计隐私保护的训练方法

图片

 

赛题方案介绍

在攻击赛道中,我们通过查询目标模型来构建提示语,促使其为每个掩盖的个人可识别信息(PII)生成候选回应,并计算其损失值,再用自我提示候选提取和基于损失的贪心搜索,选择损失值最低的候选作为最终输出。这种基于分段与聚合的损失计算方法,以加速候选项的选择过程。我们的方法在比赛提供的Llama3.1-8B模型上可以达到0.233的攻击成功率

在防御赛道中,我们利用数据脱敏与合成技术,对包含PII的语料进行随机替换,之后以自回归的方式微调目标模型,可以扰乱大模型对PII信息的记忆,降低其输出正确PII的可能,防止隐私数据泄漏。该方案使主办方提供的攻击方法成功率相对降低30.6%,同时在MMLU和TruthfulQA等基准数据集上的结果也表明该方法对模型性能几乎没有损耗。

 

产业应用

解决数据和模型的隐私安全问题,是大模型在产业界尤其是金融行业落地的重要课题。结合比赛同款方案,摩斯研发了大模型隐私保护产品,该产品融合数据脱敏、拆分学习、模型混淆、差分隐私、TEE等多种技术路线,实现大模型落地应用中的模型微调、推理全链路数据和模型隐私保护。

在行业应用方面,摩斯大模型隐私保护产品已在银行、证券等多个行业落地推进中。目前已应用在网商银行农业助贷场景,利用摩斯的大模型隐私保护技术融合多方时空大数据,共建“密态时空大模型”,进行行内农户贷款风险评估,进一步提升种植户金融放款效率和满意度。

 

持续技术创新,摩斯仍在加速!

欢迎与行业伙伴进行业务共创、产业落地合作!

 

关注我,获取更多资讯~

...全文
398 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
特等奖标准成品论文(Word无水印纯净版) 硬核结构:全文包含完整的摘要、问题重述与分析、模型假设、符号说明、模型建立与求解、灵敏度分析及结论。 即插即用:排版严格遵循官方规范,逻辑严密。拿到手即可作为绝佳的高分参考模板,稍作替换与个性化润色即可极速完稿,彻底解决写论文难的痛点。 双源硬核解题代码(Python与MATLAB双版本) 拒绝假代码:提供底层逻辑清晰、模块化设计的全套可运行源码。 全流程覆盖:涵盖从前期数据清洗预处理,到中期核心数学模型训练,再到后期启发式算法寻优。 傻瓜式运行:代码自带详尽的逐行中文注释,并支持一键生成高质量结果可视化图表,编程小白也能轻松复现与二次开发。 全量数据与结果展示表 所有中间处理数据、模型输出参数以及最终结论,均已精细整理成高质量表格。直观呈现性能评估指标与多模型对比分析,可直接作为论文正文或附件使用,极大提升学术说服力。 独家硬核思路解析 深入浅出剖析出题人意图,详细拆解每一小问的数学本质与底层逻辑,让你不仅知其然更知其所以然。 【四大核心产品优势】 高效实用:所有代码与论文均经过严格测试,确保结果精准无误、完全可复现,省去熬夜试错的时间。 全栈覆盖:从思路分析到跑出结果,再到写出高质量论文,提供一站式全流程资料矩阵。 排版辅助:资料内提供专业的论文排版一键转换工具与官方标准模板,告别格式调整的繁琐。 持续迭代:网盘直发,开赛后资料库将持续滚动更新,所有用户均可免费同步取最新包。 【适用人群】 想要打破建模瓶颈的参赛队长与主攻手;急需高质量底层代码的编程小白;目标直指特等奖需要高分模板对标的精英团队。
内容概要:本文围绕分布式光伏储能系统的优化配置方法展开,重点基于Matlab代码实现系统建模与仿真分析,涵盖光伏出力不确定性、负荷响应特性及储能充放电行为的综合建模。通过引入改进鲸鱼优化算法、粒子群算法等智能优化算法,解决系统容量配置、能量管理策略与多目标优化调度等问题,旨在提升系统运行效率、降低能耗成本并延长设备使用寿命。研究内容还包括并网与离网模式下的经济性对比、微电网能量优化管理、储能配置方案评估,并提供完整的Matlab代码、数据集及论文撰写模板,支持科研成果的高效产出。; 适合人群:具备电力系统、新能源技术或自动化等相关专业背景,熟悉Matlab/Simulink仿真环境的研究生、科研人员及工程技术人员;特别适用于计划撰写EI/SCI期刊论文的高层次研究人员。; 使用场景及目标:①开展分布式光伏储能系统配置的科研课题与学术论文撰写;②实现微电网能量管理系统的设计与优化调度算法验证;③掌握基于Matlab的多目标优化建模方法,提升在新能源系统规划与运行领域的科研创新能力。; 阅读建议:建议结合提供的Matlab代码与Simulink模型进行动手实践,重点关注优化算法的实现逻辑与参数调优过程,按照文档目录循序渐进学习,构建完整的知识体系,并参考配套论文模板完成研究成果的规范化输出。
监控系统粘贴板和时间截的小软件(开源成世) 梅菉佬--惊屎无人知 2026-06-05 ①使用电脑,经常要用到剪贴板历史的,在windows10中有系统的,但是在ubuntu24中,我找不到,找第三方软件,也是各种不顺限制,有的版本变了就无法使用,又或这样那样的要求,不如干脆自已做一个自用吧。 ②先是,读出粘贴板的历史数据,主要是文本,至于非文本格式,暂不理吧,手机粘贴板历史也是如是。 ③发现,还要加上当前时间截,这个功能很小,但很实用,很多系统没有自带这功能,自已在ubuntu24中加上lazarus用托盘小软件,轻松实现。 ④发现,最好加上常用的难打字,如,塘㙍的㙍字,这个字平时不容易打字出来,事先放入小软件中,到时当成粘贴板历史数据取出来用就行了。又发现,一些五笔中能记忆的字,也可如是,例如,逐,垂,等字。还有一些特殊符号,手机上有,电脑难找但要以显示的,例如,☆★①②③④⑤,还有,一些平时要常查但难记忆的,例如linux的命令,快捷键,也可以加入,相当于托盘记事本。。。。 ⑤还有,在ubuntu中,加入到开机启动中,测试顺利可用。还有,编程时,加入ini文件,可以使用时编写文本,不用每次编译源码。还有,要用分级菜单功能,暂定二级树形菜单,否则太难看了。刚开始用最简单的timer来读取粘贴板数据,后来找到别的API,不用timer了,但是,linux的API比起windows的API,似乎难找得多了。。。 于是,自产自用小工具产生了。实测可用。独乐乐不如众乐乐,于是,开源,念心经,惊S无人知,压惊也,这点小事被卡住,多么不抵。。。 //显式初始化GTK(安全调用)

10,047

社区成员

发帖
与我相关
我的任务
社区描述
宁可累死自己,也要卷死别人。
后端架构分布式 个人社区 河南省·郑州市
社区管理员
  • 不会压弯的小飞侠
  • Code Writers
  • 心皿月
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧