摩斯大模型方向论文成功进入AAAI顶会前4.6%

蚂蚁摩斯隐私计算论坛 2025-03-24 17:47:50

继摩斯大模型跨域微调方向论文被顶级会议AAAI录取后,在被顶会录取的13000个投稿中,成功进入前4.6%,获得2025AAAI oral presentation资格。来自摩斯的代表,于近日在费城完成演讲。

 

image.png

摩斯的代表分析了当前离线调优方法所存在的问题,现场介绍了跨域微调大模型隐私保护训练方法,和摩斯基于此背景提出的ScaleOT框架。

这种新的大模型跨域微调算法,设计了重要性感知的动态层替换模型压缩方法,有效攻克了在仿真器生成时计算复杂度高、模型隐私安全性不足等难题,为大模型隐私微调方向提供了新颖的思路与解决方案。ScaleOT框架是一种新颖的隐私效用可扩展离线调优框架,能够有效平衡隐私性和效用性,实现生产级可用。

 

9cbd68e21fd50a955642d003589dd75f.jpg

 论文地址:https://arxiv.org/pdf/2412.09812

 

这一全新的大模型隐私微调算法,已在摩斯大模型隐私安全产品上线,产品融合了数据脱敏、拆分学习、模型混淆、差分隐私、TEE等多种技术路线,实现大模型落地应用中的模型微调、推理全链路数据和模型隐私安全保护。

同时,摩斯还提供大模型算力和行业大模型服务;支持TEE GPU云服务和一体机方案;支持开源通用大模型,支持deepseek满血版,以及法律大模型、金融大模型、营销大模型等行业大模型在线加密调用。

欢迎各行业生态伙伴进行合作咨询!!

关注我,获取更多资讯~

...全文
26 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
内容概要:本书《Deep Reinforcement Learning with Guaranteed Performance》探讨了基于李雅普诺夫方法的深度强化学习及其在非线性系统最优控制中的应用。书中提出了一种近似最优自适应控制方法,结合泰勒展开、神经网络、估计器设计及滑模控制思想,解决了不同场景下的跟踪控制问题。该方法不仅保证了性能指标的渐近收敛,还确保了跟踪误差的渐近收敛至零。此外,书中还涉及了执行器饱和、冗余解析等问题,并提出了新的冗余解析方法,验证了所提方法的有效性和优越性。 适合人群:研究生及以上学历的研究人员,特别是从事自适应/最优控制、机器人学和动态神经网络领域的学术界和工业界研究人员。 使用场景及目标:①研究非线性系统的最优控制问题,特别是在存在输入约束和系统动力学的情况下;②解决带有参数不确定性的线性和非线性系统的跟踪控制问题;③探索基于李雅普诺夫方法的深度强化学习在非线性系统控制中的应用;④设计和验证针对冗余机械臂的新型冗余解析方法。 其他说明:本书分为七章,每章内容相对独立,便于读者理解。书中不仅提供了理论分析,还通过实际应用(如欠驱动船舶、冗余机械臂)验证了所提方法的有效性。此外,作者鼓励读者通过仿真和实验进一步验证书中提出的理论和技术。

87,928

社区成员

发帖
与我相关
我的任务
社区描述
陶然同学(带你学Java)社区,旨在为大家提供文明交流学习,互帮互助的一个社区,希望打造成高质量的Java领域社区,欢迎各位大佬进入。
java后端前端 个人社区 广东省·深圳市
社区管理员
  • 陶然同学
  • 多多钟意你吖
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

在这里,你可以:

1.交流学习 分享技术

欢迎您加入Java全栈社区,开始打造您的专属技术社区:https://bbs.csdn.net/forums/TaoRan?category=0

试试用AI创作助手写篇文章吧