CVPR 2024 知识蒸馏新突破!频率域FreeKD

重大阿大 2025-06-03 09:51:02

【论文标题】FreeKD: Knowledge Distillation via Semantic Frequency Prompt

【论文出处】CVPR 2024

【技术亮点】✨ FreeKD是一种新颖的知识蒸馏方法,它通过语义频率提示(Semantic Frequency Prompt)在频率域内实现知识的有效传递。该方法特别适用于密集预测任务,如目标检测和语义分割,能够显著提升学生模型的性能。

【工作原理】🔍 1. FreeKD利用离散小波变换(DWT)将教师模型的特征图分解为不同的频率带,以捕捉图像的低频和高频信息。 2. 通过频率提示,FreeKD在教师模型的微调阶段吸收语义频率上下文,并在蒸馏期间生成像素级频率掩码,精确定位各频率带中的关键像素(Points of Interest, PoIs)。

【实验结果】📈 1. 在COCO2017数据集上,FreeKD为RepPoints-R50模型带来了3.8 AP的增益,在Cityscapes数据集上,为PSPNet-R18模型带来了4.55 mIoU的增益。 2. FreeKD在大规模视觉模型(如DINO和SAM)上验证了其泛化能力,展现出比传统基于空间的蒸馏方法更优异的性能和鲁棒性。

【应用场景】🏢 1. FreeKD适用于资源受限的边缘设备,能够在保持模型大小的同时提升其预测性能。 2. 该技术还可应用于自动化驾驶、机器人视觉、智能监控等领域,为这些领域提供高效且准确的视觉识别能力。 【结语】📝 FreeKD通过在频率域内进行知识蒸馏,克服了传统空间域蒸馏方法的局限性,为构建高效且性能强大的视觉模型提供了新思路。随着深度学习在各行各业的深入应用,FreeKD有望在资源受限的设备上发挥更大的作用。

 

...全文
10 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

50

社区成员

发帖
与我相关
我的任务
社区描述
本社区由重庆大学与云从科技联合发起并共同运营,旨在打造一个开放、前沿、务实的知识共享与交流平台。 我们聚焦于两大前沿技术领域:通用语言大模型 (LLM)与知识协同技术。
软件工程 个人社区 重庆·沙坪坝区
社区管理员
  • 重大阿大
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧