摩斯营销科技大模型方向论文被顶会AAAI录用

蚂蚁摩斯隐私计算论坛 2025-02-21 14:11:31

近日,国际人工智能顶级学术会议AAAI 2025放榜,摩斯团队在大模型隐私微调方向论文被该会议录用!

要让大模型适应各不一样的下游任务,微调必不可少。常规的中心化微调过程需要模型和数据存在于同一位置 —— 要么需要数据所有者上传数据(这会威胁到数据所有者的数据隐私),要么模型所有者需要共享模型权重(这又可能泄露自己花费大量资源训练的模型)。此外,在第二种情况下,模型的参数可能暴露,这可能会增加其微调模型受到攻击的可能性。这些问题都可能阻碍 LLM 的长期发展。

为了有效地保护模型所有权和数据隐私,浙江大学、蚂蚁数科、利物浦大学和华东师范大学的朱建科与王维团队提出了一种全新的跨域微调(offsite-tuning)框架:ScaleOT。该框架可为模型隐私提供多种不同规模的有损压缩的仿真器,还能促进无损微调(相比于完整的微调)。该研究论文已被人工智能顶会 AAAI 2025 录用。第一作者为姚凯(蚂蚁摩斯高级算法工程师,浙大博后),通讯作者为朱建科教授与王维老师。

 

图片

  • 论文标题:ScaleOT: Privacy-utility-scalable Offsite-tuning with Dynamic LayerReplace and Selective Rank Compression

  • 论文地址:https://arxiv.org/pdf/2412.09812

 

原生跨域微调的不足之处

 

如下图 2(b) 所示,跨域微调(OT)不是使用完整的模型进行训练,而是允许数据所有者使用模型所有者提供的有损压缩仿真器进行微调,但这种范式有个缺点:会让数据所有者得到的仿真器的性能较差。然后,训练得到的适配器会被返回给模型所有者,并被插入到完整模型中,以创建一个高性能的微调模型。特别需要指出,数据所有者和模型所有者端之间的模型性能差异是模型隐私的关键因素,这会促使下游用户使用微调的完整模型。

 

图片

因此,跨域微调的主要难题在于高效压缩 LLM,通过在维持性能差异的同时提升微调的完整模型,从而实现对模型隐私的保护。

遵循跨域微调策略,原生 OT 方法采用的策略是 Uniform LayerDrop(均匀层丢弃),从完整模型中均匀地删除一部分层,如图 3(a)所示。

 

图片

图 3:分层压缩策略比较。(a)Uniform LayerDrop;(b)带估计的重要性分数的 Dynamic LayerDrop;(c)带协调器的 Dynamic LayerReplace;(d)使用不同压缩比的结果。新方法在所有者端实现了更好的性能,同时保持了性能差异。

然而,尽管大型模型中的许多参数是冗余的,但每层的重要性差异很大,这种均匀删除可能会导致适应后的完整模型的性能下降。此外,直接的层删除会导致被删除层的输入和输出隐藏空间之间错位,这也会导致所有者端的性能下降。虽然知识蒸馏可以缓解这个问题,但训练一个所需的仿真器的成本至少是 LLM 大小的一半,这意味着巨大的训练成本为提供具有不同压缩比的仿真器带来了重大缺陷。

 

摩斯ScaleOT跨域微调方案的独特之处

 

如上图 2 (c) 所示,该框架由两个阶段组成:重要性估计和仿真器生成。

对于第一阶段,摩斯团队提出了一种基于重要性感知型层替换的算法 Dynamic LayerReplace,该算法需要使用一种强化学习方法来确定 LLM 中每一层的重要性。同时,对于不太重要的层,动态选择并训练一组可训练的协调器作为替代,这些协调器是轻量级网络,可用于更好地实现剩余层的对齐。

在第二阶段,根据学习到的重要性得分,可将原始模型层及其对应的协调器以各种方式组合到一起,从而得到仿真器(emulator),同时还能在模型所有者端维持令人满意的性能,如图 3 (d) 所示。

他们根据实践经验发现,如果使用秩分解来进一步地压缩剩余的模型层,还可以更好地实现隐私保护,同时模型的性能下降也不会太多。基于这一观察,摩斯团队提出了选择性秩压缩(SRC)方法。

摩斯团队进行了大量实验,涉及多个模型和数据集,最终证明新提出的方法确实优于之前的方法,同时还能调整压缩后仿真器模型的大小以及 SRC 中的秩约简率。因此,这些新方法的有效性和可行性都得到了验证。

 

总结起来,摩斯团队的这项研究做出了三大贡献:

  • 提出了一种灵活的方法,可为跨域微调得到多种大小的压缩版模型:提出了一种重要性感知型有损压缩算法 Dynamic LayerReplace,该算法面向使用 LLM 的跨域微调,可通过强化学习和协调器来扩展仿真器。这些组件可以实现灵活的多种规模的压缩模型生成。

  • 仅需一点点微调性能下降,就能通过进一步的压缩获得更好的隐私:新提出的选择性秩压缩策略仅需少量性能损失就能进一步提升模型隐私。

  • 全面的实验表明,新提出的 ScaleOT 优于当前最佳方法。

 

这种新的大模型跨域微调算法,设计了重要性感知的动态层替换模型压缩方法,有效攻克了在仿真器生成时计算复杂度高、模型隐私安全性不足等难题,为大模型隐私微调方向提供了新颖的思路与解决方案。  

 

这一全新的大模型隐私微调算法,现已融入摩斯大模型隐私保护产品。该产品融合多种技术路线,实现大模型落地应用中的模型微调、推理全链路数据和模型隐私保护,并成为首批通过信通院大模型可信执行环境产品专项测试的产品之一。目前摩斯大模型隐私保护产品已在银行、证券等多个行业落地推进中。在某银行农业助贷场景,利用摩斯的大模型隐私保护技术融合多方时空大数据,共建“密态时空大模型”,进行行内农户贷款风险评估,进一步提升种植户金融放款效率和满意度。

 

摩斯营销科技持续创造行业价值

 

目前摩斯隐私计算产品已在上百家银行等金融机构部署使用,全行业已部署300多家,建立以隐私计算节点网络连接的资源网络,包含数据源和流量场景的资源网络。在营销场景下,可以帮助企业实现公私域客群安全打通,帮助企业制定全生命周期的客群经营增长策略。  

  • 在金融机构营销场景,摩斯通过隐私计算技术,可以打通机构公私域客群,进行客群一体化分析;通过多方资源连接,共建密态模型,进行用户洞察分析,帮助机构制定拉新、促活、召回全生命周期客群经营增长策略;通过摩斯营销平台连接支付宝、饿了么等数十个流量平台,帮助机构进行自助化、智能化营销投放。

  • 针对银行卡用户,我们提供全生命周期的营销服务,在发卡、绑卡、促活等各阶段,采用隐私计算技术安全合规使用多方数据来实现精准营销。

 

未来,摩斯也将持续投入隐私智能领域,在大模型安全、互联互通等技术难题上持续突破,并通过摩斯隐私计算产品安全连接全渠道分布式的流量场景平台、数据源等,助力数据安全流通与价值释放,提升客群分析与精准营销服务能力。

 

关注我,获取更多资讯~

...全文
424 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
源码直接下载地址: https://pan.quark.cn/s/a4b39357ea24 过采样与欠采样构成了数字信号处理领域中两种基础的采样策略,它们在工程实践应用时各自展现出独特的长处与短处及适用情境。以下将深入阐释这两种采样方法的运作机制,并对它们在实际操作中的区别进行细致对比。 我们首先阐释过采样的核心概念。过采样(Oversampling)一般是指运用高于必要标准频率对模拟信号实施采样。举例而言,当信号频率为70MHz且信号带宽为20MHz时,依据奈奎斯特采样准则,理论上采样频率只需略高于40MHz(即信号带宽频率的两倍)即可达成无失真采样。然而,在现实操作中,系统构造者常常会采用超过140MSPS(每秒百万次采样)的采样速率,这通常超出理论所需。过采样的主要不利之处涵盖:提升ADC输出数据速率,引发FPGA的时序挑战;增大功耗、ADC及FPGA的制造成本。尽管存在这些不足,过采样依然具备其有利之处,例如可提供处理增益、频率规划的伸缩性以及能够处理更宽的信号带宽。 接下来,我们探讨欠采样的基本原理。欠采样(Undersampling)是指以低于理论标准频率对信号进行采样,这在处理高输入信号频率时尤为有效。例如,针对70MHz的中频(IF)信号,通过欠采样能够采用低于40MHz的采样频率进行采样,从而将数据速率降至FPGA,减少时序挑战,节省能量消耗和成本。实现欠采样的关键设计考量在于它能够在系统设计中达成所需的ADC动态性能。 欠采样的优势体现为能够简化硬件构造,比如降低对高速数据捕获的需求,并且在设计条件允许时,可选用较慢的ADC来削减成本。然而,欠采样技术也存在其局限性,例如在ADC的非理想表现可能导致非线性失真,诸如二阶(HD2)和三阶(HD3)谐...
内容概要:本文系统介绍了基于TI TMS320C5416芯片设计IIR带阻和陷波滤波器的方法,重点采用双线性变换法(BLT)和极点-零点配置法进行数字滤波器的设计。文档涵盖滤波器设计的理论基础、关键参数设定、Matlab代码实现流程以及在DSP硬件平台上的部署思路,帮助读者掌握从模拟原型设计到数字映射,再到硬件实现的完整技术链条。同时强调通过Matlab仿真验证滤波器频率响应特性,并指导如何将算法移植至TMS320C5416平台实现实际信号处理功能; 适合人群:具备数字信号处理基础理论知识和Matlab编程能力,从事通信系统、音频处理、嵌入式开发等相关领域的研究生及工程技术人员; 使用场景及目标:①深入理解IIR滤波器设计的核心原理,特别是双线性变换法避免频率混叠的优势;②掌握通过极点-零点布局设计特定频率响应的带阻与陷波滤波器;③实现对特定干扰频率的有效抑制,如工频干扰去除;④完成从Matlab算法仿真到TMS320C5416 DSP平台的代码移植与实时验证; 阅读建议:建议读者结合所提供的Matlab代码动手实践滤波器设计全过程,深入理解每一步背后的数学推导与物理意义,并尝试调整滤波器参数观察性能变化,最终将设计成果部署到实际DSP系统中进行测试与优化。

122,624

社区成员

发帖
与我相关
我的任务
社区描述
好记性不如烂笔头,欢迎大家交流Matlab技术!
matlab 个人社区 四川省·成都市
社区管理员
  • 珞瑜·
  • CSDN-Ada助手
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

欢迎大家交流Matlab技术!互相成就互相成长!

试试用AI创作助手写篇文章吧