【论文精读】CVPR2022 - 解耦知识蒸馏
社区首页
2455 




最新发布
最新回复
标题
阅读量
内容评分
精选
显示侧栏
切换为经典版
3
评分
回复

【论文精读】CVPR2022 - 解耦知识蒸馏
目前的蒸馏方法主要基于从中间层蒸馏深层特征,而logit蒸馏的意义被大大忽视。为了为研究logit蒸馏提供一个新的观点,我们将经典的KD损失重新表述为两部分,即目标类知识蒸馏(TCKD)和非目标类知识蒸馏(NCKD)。我们通过实证研究和证明了这两部分的影响: TCKD转移了关于训练样本的“困难”的知识,而NCKD是logit蒸馏工作有效的主要原因。更重要的是,我们揭示了经典的KD损失是一个耦合公式,它(1)抑制了NCKD的有效性,(2)限制了平衡这两部分的灵活性。
复制链接 扫一扫
分享
目标检测识别与跟踪

2
评分
回复

【论文速递】CSET - 小数据的大AI潜力
【论文速递】CSET - 小数据的大AI潜力
复制链接 扫一扫
分享
AI综述
1
评分
回复

# 【论文速递】CVPR2021 - ReDet:一种用于航空目标检测的旋转等变检测器
最近,航空图像中的目标检测在计算机视觉中引起了广泛的关注。与自然图像中的物体不同,空中物体通常以任意方向分布。因此,检测器需要更多的参数来编码方向信息,这通常是高度冗余和低效的。此外,由于普通CNN没有明确地对方向变化进行建模,因此需要大量的旋转增强数据来训练准确的目标检测器。在本文中,我们提出了一种旋转等变检测器(ReDet)来解决这些问题,它明确编码了旋转等变性和旋转不变性。更准确地说,我们将旋转等变网络纳入检测器以提取旋转等变特征,这可以准确预测方向并导致模型尺寸的大幅减小。基于旋转等变特征,
复制链接 扫一扫
分享
目标检测识别与跟踪
6
评分
回复

【论文速递】-2022-金融研究-系统性金融风险文献综述:现状、发展与展望
【论文速递】-2022-金融研究-系统性金融风险文献综述:现状、发展与展望
复制链接 扫一扫
分享
综合板块
4
评分
回复

【论文速递】-2022-JF-The Pollution Premium
【论文速递】-2022-JF-The Pollution Premium
复制链接 扫一扫
分享
综合板块

3
评分
回复

论文速递-2022-JFE-Liquidity in the global currency market
论文速递-2022-JFE-Liquidity in the global currency market
复制链接 扫一扫
分享
综合板块
3
评分
回复

【论文速递】ACL 2020 - 多媒体事件抽取的跨媒体结构化公共空间
【论文速递】ACL 2020 - 多媒体事件抽取的跨媒体结构化公共空间
复制链接 扫一扫
分享
NLP

3
评分
回复

【论文速递】CVPR 2020 - CLIP-Event:用事件结构连接文本和图像
【论文速递】CVPR 2020 - CLIP-Event:用事件结构连接文本和图像
复制链接 扫一扫
分享
NLP

2
评分
回复

【论文速递】ACM MM 2022 - 基于统一对比学习框架的新闻多媒体事件抽取
【论文速递】ACM MM 2022 - 基于统一对比学习框架的新闻多媒体事件抽取
复制链接 扫一扫
分享
NLP
2
评分
回复

【论文速递】ACL 2020 - 一种用于关系三元组抽取的级联二元标记框架
【论文速递】ACL 2020 - 一种用于关系三元组抽取的级联二元标记框架
复制链接 扫一扫
分享
NLP
4
评分
回复

【论文速递】CVPR2022 - 多少观察才足够?用于轨迹预测的知识蒸馏
准确预测未来的人类位置是现代视频监控系统的一项基本任务。当前最先进的模型通常依赖于过去跟踪位置的“历史记录”(例如,3到5秒)来预测未来位置的合理序列(例如,最多5秒)。由于输入轨迹的收集涉及机器感知(即检测和跟踪),因此在拥挤的场景中可能会累积不正确的检测和碎片错误,从而导致跟踪漂移。在这种情况下,模型将被馈送损坏和嘈杂的输入数据,从而致命地影响其预测性能。在这方面,我们专注于在仅使用少量输入观察时提供准确的预测,从而潜在地降低与自动感知相关的风险。为此,
复制链接 扫一扫
分享
目标检测识别与跟踪
4
评分
回复

【论文速递】WACV2023- 用于多任务学习的在线知识蒸馏
多任务学习(MTL)在计算机视觉任务中得到了广泛的应用。我们训练一个骨干网络来学习不同任务的共享表示,例如语义分割、深度和正态估计。在许多情况下,负传输,即目标域中的性能受损,导致MTL精度低于训练相应的单任务网络。为了缓解这个问题,我们提出了一种在线知识蒸馏方法,其中单任务网络与MTL网络同时训练以指导优化过程。我们建议使用自适应特征蒸馏(AFD)损失和在线任务加权(OTW)方案为每个任务选择性地训练层。这种任务特征蒸馏使MTL网络能够以与单任务网络类似的方式进行训练。
复制链接 扫一扫
分享
目标检测识别与跟踪

7
评分
回复

前沿学术报告:标签高效的半监督语义分割
前沿学术报告:标签高效的半监督语义分割
复制链接 扫一扫
分享
学术报告
3
评分
回复

【论文速递】TPAMI2023 - 基于关系匹配的广义知识蒸馏
训练有素的深度神经网络(又名“老师”)的知识对于学习类似的任务很有价值。知识蒸馏从教师那里提取知识,并将其与目标模型(又称“学生”)整合,从而扩展学生的知识并提高其学习效率。我们不是强迫老师和学生一起完成同样的任务,而是从通用标签空间训练教师并提取它的知识 ——在这个“广义知识蒸馏(GKD)”中,老师和学生的类别可能相同、完全不同或部分重叠。我们声称实例之间的比较能力是跨任务传递知识的基本因素,并提出了一种相互关联的局部半分类器蒸馏(REFILLED)方法,该方法解耦了嵌入的GKD流和顶层分类器。特别是,
复制链接 扫一扫
分享
目标检测识别与跟踪
2
评分
回复

【论文速递】基于批量归一化的混洗SGD训练不稳定性
【论文速递】基于批量归一化的混洗SGD训练不稳定性_lucid7490的博客-CSDN博客
复制链接 扫一扫
分享
语义分割
4
评分
回复

【论文速递】TGRS2023 - 用于遥感图像中高效目标检测的实例感知蒸馏
实际应用要求目标检测模型能够以低开销实现高性能。在这种情况下,知识蒸馏通过将知识从繁琐的教师模式转移到轻量级学生模式来展示有利的潜力。然而,以前的蒸馏方法受到遥感图像中大量误导性背景信息的困扰,而忽略了对不同实例之间关系的研究。在本文中,我们提出了一种实例感知蒸馏(简称InsDist)方法来推导出高效的遥感目标检测器。我们的InsDist结合了基于特征和基于关系的知识蒸馏,以充分利用从教师到学生的知识转移中与实例相关的信息。
复制链接 扫一扫
分享
目标检测识别与跟踪

4
评分
回复

【论文速递】CASE 2022 - EventGraph: 将事件抽取当作语义图解析任务
【论文速递】CASE 2022 - EventGraph: 将事件抽取当作语义图解析任务
复制链接 扫一扫
分享
NLP

6
评分
回复

【论文速递】WACV 2023 - 一种全卷积Transformer的医学影响分割模型
【论文速递】WACV 2023 - 一种全卷积Transformer的医学影响分割模型
复制链接 扫一扫
分享
语义分割

6
评分
回复

【论文速递】EMNLP 2022 - 一种大规模中文标题数据集的开放事件抽取基准
【论文速递】EMNLP 2022 - 一种大规模中文标题数据集的开放事件抽取基准
复制链接 扫一扫
分享
NLP

6
评分
回复

【论文精读】Review of Finance, 2022 -Climate Change Risk and the Cost of Mortgage Credit
【论文精读】Review of Finance, 2022 -Climate Change Risk and the Cost of Mortgage Credit_leiaaa-的博客-CSDN博客
复制链接 扫一扫
分享
综合板块
为您搜索到以下结果:
发帖

论文速递 | 精选


论文速递 | 精选
【论文速递 | 精选】社区,长期速递前沿论文,精选精析经典学术成果!很高兴认识你!社区持续建设!招收合约博主!加入我们共同进步!
复制链接 扫一扫
1609
社区成员
128
社区内容
【论文速递 | 精选】社区,长期速递前沿论文,精选精析经典学术成果!很高兴认识你!社区持续建设!招收合约博主!加入我们共同进步!
论文阅读 个人社区 北京·海淀区
加入社区
获取链接或二维码
社区公告
CSDN社区【论文速递 | 精选】
长期速递前沿论文,精选精析经典学术成果!
社区建设中!目前仅支持学术讨论!
社区招收合约博主!很高兴认识你!加入我们共同进步!
地址:https://bbs.csdn.net/forums/paper
微信公众号【AIEarth】(点击下方图片了解)
