保护大模型隐私安全,摩斯获NeurIPS顶会“2024大模型隐私挑战赛赛道冠军”

蚂蚁摩斯隐私计算论坛 2024-11-29 10:09:44

开篇

近日,第三十八届神经信息处理系统年会(NeurIPS 2024)特设官方赛——大语言模型隐私挑战赛(LLM-PC)落幕。摩斯联合浙江大学计算机体系结构实验室陈文智、魏成坤团队共9人组成了“Morse & ARCLab”参赛队伍,荣获该赛事全部两个赛道中攻击赛道的冠军防御赛道的最佳实用防御奖。赛题聚焦大语言模型训练数据的隐私安全,有助于推动整个领域向构建更加安全、可靠的AI系统目标前进,冠军方案也代表着当前业界领先技术。  

图片

图片

 

赛事信息

NeurIPS是机器学习领域三大顶级国际会议之一,也是中国计算机学会A类推荐会议。本次特设竞赛于2024年7月底开始,由加州大学伯克利分校、德州大学奥斯汀分校、伊利诺伊大学厄巴纳-香槟分校、新加坡国立大学、Center for AI Safety等高校与机构联合命题组织,吸引来自数十个国家超30支队伍参与角逐。本次参赛者的任务是设计与实现创新解决方案,从下游模型中窃取训练数据中的隐私设计隐私保护的训练方法

图片

 

赛题方案介绍

在攻击赛道中,我们通过查询目标模型来构建提示语,促使其为每个掩盖的个人可识别信息(PII)生成候选回应,并计算其损失值,再用自我提示候选提取和基于损失的贪心搜索,选择损失值最低的候选作为最终输出。这种基于分段与聚合的损失计算方法,以加速候选项的选择过程。我们的方法在比赛提供的Llama3.1-8B模型上可以达到0.233的攻击成功率

在防御赛道中,我们利用数据脱敏与合成技术,对包含PII的语料进行随机替换,之后以自回归的方式微调目标模型,可以扰乱大模型对PII信息的记忆,降低其输出正确PII的可能,防止隐私数据泄漏。该方案使主办方提供的攻击方法成功率相对降低30.6%,同时在MMLU和TruthfulQA等基准数据集上的结果也表明该方法对模型性能几乎没有损耗。

 

产业应用

解决数据和模型的隐私安全问题,是大模型在产业界尤其是金融行业落地的重要课题。结合比赛同款方案,摩斯研发了大模型隐私保护产品,该产品融合数据脱敏、拆分学习、模型混淆、差分隐私、TEE等多种技术路线,实现大模型落地应用中的模型微调、推理全链路数据和模型隐私保护。

在行业应用方面,摩斯大模型隐私保护产品已在银行、证券等多个行业落地推进中。目前已应用在网商银行农业助贷场景,利用摩斯的大模型隐私保护技术融合多方时空大数据,共建“密态时空大模型”,进行行内农户贷款风险评估,进一步提升种植户金融放款效率和满意度。

 

持续技术创新,摩斯仍在加速!

欢迎与行业伙伴进行业务共创、产业落地合作!

 

关注我,获取更多资讯~

 

...全文
456 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
内容概要:本文针对含分布式发电的微电网中储能装置容量的优化配置问题展开深入研究,提出了一种基于改进鲸鱼优化算法的能量管理策略,旨在提升微电网在并网与离网模式下的运行效率、经济性与稳定性。研究系统性地探讨了储能系统在平抑风电功率波动、电-氢混合储能协同配置、应对分布式电源不确定性等方面的综合应用,结合Matlab代码实现了多场景仿真分析。通过引入鲁棒优化、多目标调度与需求响应机制,构建了兼顾技术可行性与经济成本的完整优化框架,并对不同运行模式下的储能配置方案进行了对比评估,有效解决了高比例可再生能源接入带来的调度难题。; 适合人群:适用于具备电力系统、新能源科学、自动化或电气工程等相关专业背景,熟悉Matlab/Simulink仿真环境,且从事微电网、储能技术、智能优化算法等领域科研与工程实践的研究人员,特别适合致力于撰写高水平学术论文的硕士、博士研究生及青年教师。; 使用场景及目标:①为微电网中储能系统的容量规划、选型设计与经济性评估提供理论依据与仿真支持;②支撑高渗透率可再生能源场景下的能量管理策略开发与优化调度决策;③为科研工作者复现EI/SCI级别论文模型、改进智能优化算法(如鲸鱼算法)提供完整代码与数据参考;④服务于实际微电网项目中的储能配置、运行控制与经济运行分析等工程应用场景。; 阅读建议:建议读者结合所提供的Matlab代码与可能的Simulink模型进行动手实践,重点理解算法设计思路、目标函数构建与约束条件处理方式,对比不同优化策略的性能差异,并参考文中提及的高水平论文复现路径,深化对微电网储能优化配置问题的整体认知与科研创新能力。

33,026

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧