【YOLOv10改进 -卷积Conv】 RFB (Receptive Field Block):多分支卷积块
社区首页 (3598)




请编写您的帖子内容
社区频道(3)
显示侧栏
卡片版式
博文收录
吹水
Ada助手

95
评分
回复


【YOLOv10改进 -卷积Conv】 RFB (Receptive Field Block):多分支卷积块
当前表现最好的目标检测器依赖于深度卷积神经网络(CNN)骨干,例如ResNet-101和Inception,得益于其强大的特征表示能力,但却面临高计算成本。相反,一些轻量级模型的检测器可以实现实时处理,但其准确性常常受到批评。本文中,我们探索了一种替代方法,通过使用手工设计的机制来增强轻量级特征,从而构建一个快速且准确的检测器。受人类视觉系统中感受野(RF)结构的启发,我们提出了一种新颖的感受野块(RFB)模块,该模块考虑了感受野的大小和偏心率之间的关系,以增强特征的可辨性和鲁棒性。
复制链接 扫一扫
分享

149
评分
回复


【YOLOv10改进- -卷积Conv】动态蛇形卷积(Dynamic Snake Convolution)用于管状结构分割任务
精确分割拓扑管状结构,例如血管和道路,对各个领域至关重要,可确保下游任务的准确性和效率。然而,许多因素使任务变得复杂,包括细小脆弱的局部结构和复杂多变的全局形态。在这项工作中,我们注意到管状结构的特殊特征,并利用这一知识来引导我们的 DSCNet 在三个阶段同时增强感知:特征提取、特征融合和损失约束。首先,我们提出了一种动态蛇形卷积,通过自适应地聚焦于细长和曲折的局部结构,来准确捕捉管状结构的特征。
复制链接 扫一扫
分享

78
评分
回复


【YOLOv10改进-注意力机制】MSCAAttention多尺度卷积注意力
我们提出了SegNeXt,一种用于语义分割的简单卷积网络架构。最近基于变换器的模型由于自注意力在编码空间信息方面的效率而在语义分割领域占据主导地位。在本文中,我们展示了卷积注意力是一种比变换器中的自注意力机制更高效和有效的编码上下文信息的方式。通过重新审视成功的分割模型所拥有的特征,我们发现了几个关键组件,这些组件导致了分割模型性能的提升。这激励我们设计了一种新颖的卷积注意力网络,该网络使用廉价的卷积操作。
复制链接 扫一扫
分享

101
评分
回复


【YOLOv10改进 -卷积Conv】 AKConv(可改变核卷积):任意数量的参数和任意采样形状的即插即用的卷积
AKConv(可改变核卷积),主要用来解决传统卷积中固有的缺陷。传统卷积中,每个神经元只关注输入数据中一个固定大小的局部区域,而不能有效地捕捉到其他窗口的信息。这在处理全局上下文信息时可能会限制网络的性能。传统卷积网络中的卷积核大小通常是固定的(如 3x3, 5x5)。这种固定尺寸的核可能不适合捕捉所有尺度的特征。例如,较小的核可能适合捕捉细粒度的特征,而较大的核可能更适合捕捉更宽泛的特征。固定的卷积核尺寸和结构限制了网络在处理多尺度特征时的灵活性和有效性。
复制链接 扫一扫
分享

117
评分
回复


【YOLOv8改进 - 卷积Conv】DCNv4: 可变形卷积,动态与稀疏操作高效融合的创新算子
我们介绍了可变形卷积 v4(DCNv4),这是一种设计用于广泛视觉应用的高效和有效的算子。DCNv4通过两个关键增强来解决其前身 DCNv3 的限制:1. 在空间聚合中移除了softmax标准化,以增强其动态特性和表达能力;2. 优化内存访问,减少冗余操作以加快速度。这些改进使得DCNv4的收敛速度显著更快,处理速度大幅提升,前向速度比DCNv3提高了三倍以上。DCNv4在图像分类、实例和语义分割等各种任务中表现出色,特别是在图像生成领域。
复制链接 扫一扫
分享

72
评分
回复


【YOLOv10改进 -卷积Conv】 OREPA(Online Convolutional Re-parameterization):在线卷积重参数化
结构重参数化在各种计算机视觉任务中引起了越来越多的关注。它旨在提高深度模型的性能,同时不引入任何推理时间成本。虽然在推理过程中效率很高,但这些模型在复杂的训练阶段中依赖于复杂的训练块来达到高准确性,导致额外的大量训练成本。本文介绍了在线卷积重参数化(OREPA),这是一个两阶段的流程,旨在通过将复杂的训练阶段块压缩为单个卷积来减少巨大的训练开销。为了实现这个目标,我们引入了一个线性缩放层,以更好地优化在线块。在降低训练成本的同时,我们还探索了一些更有效的重参数化组件。
复制链接 扫一扫
分享

159
评分
回复


【YOLOv10改进 - 特征融合】DySample :超轻量级且高效的动态上采样器
我们提出了DySample,这是一种超轻量且高效的动态上采样器。尽管最近基于内核的动态上采样器(如CARAFE、FADE和SAPA)在性能上取得了显著提升,但它们引入了大量工作负载,主要是由于耗时的动态卷积以及用于生成动态内核的额外子网络。此外,FADE和SAPA需要高分辨率特征的指导,这在某种程度上限制了它们的应用场景。为了解决这些问题,我们绕过了动态卷积,从点采样的角度来构建上采样,这种方法更节省资源,并且可以轻松使用PyTorch中的标准内置函数实现。
复制链接 扫一扫
分享

80
评分
回复


【YOLOv8改进 - 注意力机制】Triplet Attention:轻量有效的三元注意力
得益于在通道或空间位置之间构建相互依赖关系的能力,注意力机制在最近被广泛研究并广泛应用于各种计算机视觉任务中。在本文中,我们研究了轻量但有效的注意力机制,并提出了三重注意力,这是一种通过使用三分支结构捕获跨维度交互来计算注意力权重的新方法。对于输入张量,三重注意力通过旋转操作及后续的残差变换构建维度间依赖关系,并以可忽略的计算开销编码通道间和空间信息。我们的方法简单且高效,可以作为附加模块轻松插入经典骨干网络中。
复制链接 扫一扫
分享

72
评分
回复


【YOLOv10改进-注意力机制】CoordAttention: 用于移动端的高效坐标注意力机制
近期的移动网络设计研究显示,通道注意力(例如,压缩-激励注意力)在提升模型性能方面具有显著效果,但它们通常忽略了位置信息,而这对于生成空间选择性的注意力图是非常重要的。在本文中,我们通过将位置信息嵌入到通道注意力中,提出了一种用于移动网络的新型注意力机制,我们称之为“坐标注意力”。与通过2D全局池化将特征张量转换为单个特征向量的通道注意力不同,坐标注意力将通道注意力分解为沿两个空间方向分别聚合特征的两个1D特征编码过程。通过这种方式,可以沿一个空间方向捕获长距离依赖,同时沿另一个空间方向保留精确的位置信息。
复制链接 扫一扫
分享

75
评分
回复


【YOLOv10改进-特征融合】YOLO-MS MSBlock : 分层特征融合策略
我们旨在为目标检测领域提供一种高效且性能卓越的目标检测器,称为YOLO-MS。其核心设计基于一系列调查研究,关于不同核心大小的卷积如何影响不同尺度物体的检测性能。研究结果是一种新策略,能够显著增强实时目标检测器的多尺度特征表示能力。为验证我们策略的有效性,我们构建了一个网络架构,命名为YOLO-MS。我们从零开始在MS COCO数据集上训练我们的YOLO-MS,不依赖于任何其他大规模数据集,如ImageNet,或预训练权重。
复制链接 扫一扫
分享

93
评分
回复


【YOLOv10改进-卷积Conv】DualConv( Dual Convolutional):用于轻量级深度神经网络的双卷积核
CNN架构通常对内存和计算资源的要求较高,这使得它们在硬件资源有限的嵌入式系统中难以实现。我们提出了一种用于构建轻量级深度神经网络的双卷积核(DualConv)方法。DualConv结合了3×33 \times 33×3和1×11 \times 11×1的卷积核,同时处理相同的输入特征图通道,并利用组卷积技术高效地排列卷积滤波器。DualConv可以应用于任何CNN模型,例如用于图像分类的VGG-16和ResNet-50,用于目标检测的YOLO和R-CNN,或用于语义分割的FCN。
复制链接 扫一扫
分享

78
评分
回复


【YOLOv10改进-注意力机制】 MSDA:多尺度空洞注意力 (论文笔记+引入代码)
作为事实上的解决方案,标准的视觉变换器(ViTs)被鼓励模拟任意图像块之间的长距离依赖性,而全局关注的接受域导致了二次计算成本。视觉变换器的另一个分支受到CNNs启发,利用局部注意力,只模拟小邻域内块之间的交互。尽管这样的解决方案降低了计算成本,但它自然会受到小的关注接受域的限制,这可能会限制性能。在这项工作中,我们探索有效的视觉变换器,以追求计算复杂性和关注接受域大小之间的理想折衷。
复制链接 扫一扫
分享

79
评分
回复


【YOLOv10改进 - 注意力机制】Triplet Attention:轻量有效的三元注意力
得益于在通道或空间位置之间构建相互依赖关系的能力,注意力机制在最近被广泛研究并广泛应用于各种计算机视觉任务中。在本文中,我们研究了轻量但有效的注意力机制,并提出了三重注意力,这是一种通过使用三分支结构捕获跨维度交互来计算注意力权重的新方法。对于输入张量,三重注意力通过旋转操作及后续的残差变换构建维度间依赖关系,并以可忽略的计算开销编码通道间和空间信息。我们的方法简单且高效,可以作为附加模块轻松插入经典骨干网络中。
复制链接 扫一扫
分享

83
评分
回复


【YOLOv10改进- 特征融合】 YOGA iAFF :注意力机制在颈部的多尺度特征融合
我们推出 YOGA,这是一种基于深度学习的轻量级目标检测模型,可以在低端边缘设备上运行,同时仍能实现有竞争力的准确性。YOGA 架构由一个具有廉价线性变换的两阶段特征学习管道组成,它仅使用传统卷积神经网络所需的一半卷积滤波器来学习特征图。此外,它使用注意力机制在颈部执行多尺度特征融合,而不是传统检测器使用的朴素串联。YOGA 是一种灵活的模型,可以轻松地放大或缩小几个数量级,以适应广泛的硬件限制。
复制链接 扫一扫
分享

73
评分
回复


手把手教你搭建YOLOV8+CUDA环境,训练自定义数据集,训练推理验证导出。小白也能看得懂的!
YOLO(You Only Look Once)系列算法因其高效、准确等特点而备受瞩目。由2023年Ultralytics公司发布了YOLO的最新版本YOLOv8是结合前几代YOLO的基础上的一个融合改进版。本文主要介绍YOLOv8环境搭建/数据集获取/训练/推理/验证/导出/部署
复制链接 扫一扫
分享

69
评分
回复


【YOLOv10改进-注意力机制】iRMB: 倒置残差移动块 (论文笔记+引入代码)
本论文旨在开发现代、高效、轻量的密集预测模型,并在参数、浮点运算次数与性能之间寻求平衡。虽然倒置残差块(IRB)是轻量级卷积神经网络(CNN)的重要基础,但在基于注意力的研究中尚缺类似的构件。本研究从统一视角出发,结合高效IRB和有效的Transformer组件,重新考虑轻量级基础架构。我们将基于CNN的IRB扩展到基于注意力的模型,并提出了一种单残差元移动块(MMB)用于轻量级模型设计。
复制链接 扫一扫
分享

99
评分
回复


【YOLOv10改进- 特征融合NECK】CARAFE:轻量级新型上采样算子,助力细节提升
特征上采样是许多现代卷积网络架构中的关键操作,例如特征金字塔。其设计对于密集预测任务(如目标检测和语义/实例分割)至关重要。在这项工作中,我们提出了内容感知特征重组(CARAFE),这是一种通用、轻量且高效的操作符,以实现这一目标。CARAFE 具有以下几个吸引人的特性:(1)大视野。与之前的工作(例如双线性插值)仅利用子像素邻域不同,CARAFE 可以在大的感受野内聚合上下文信息。(2)内容感知处理。
复制链接 扫一扫
分享

72
评分
回复


【YOLOv8改进 - 特征融合NECK】 DAMO-YOLO之RepGFPN :实时目标检测的创新型特征金字塔网络
在文章中,我们介绍了一种快速且准确的目标检测方法,称为DAMO-YOLO,其性能优于最先进的YOLO系列。DAMO-YOLO在YOLO的基础上扩展了几项新技术,包括神经架构搜索(Neural Architecture Search,NAS)、高效的重参数化通用FPN(RepGFPN)、带有AlignedOTA标签分配的轻量化检测头和蒸馏增强。
复制链接 扫一扫
分享

82
评分
回复


万字详解YOLOv8网络结构Backbone/neck/head以及Conv、Bottleneck、C2f、SPPF、Detect等模块
YOLOv8是由Ultralytics开发的最先进的目标检测模型,推升了速度、准确性和用户友好性的界限。YOLO这一缩写代表“你只看一次”(You Only Look Once),通过在一次网络传递中同时预测所有边界框,提升了算法的效率和实时处理能力。相比之下,其他一些目标检测技术需要经过多个阶段或过程来完成检测。YOLOv8在流行的YOLOv5架构上进行了扩展,在多个方面提供了改进。
复制链接 扫一扫
分享

80
评分
回复


写给初学者的YOLO目标检测 概述
目标检测(Object detection)是计算机视觉中使用的一种技术,用于识别和定位图像或视频中的对象。图像定位是指使用边界框(bounding boxes)来识别一个或多个对象的正确位置的过程,这些边界框对应于围绕对象的矩形形状。这个过程有时会与图像分类或图像识别混淆,后者旨在将图像或图像中的对象预测为类别或类别之一。下面的插图对应于上述解释的计算机视觉技术。在图像中检测到的对象是“人”。在本文中,将首先了解目标检测的优势,然后介绍最先进的目标检测算法YOLO。在第二部分中,我们将更加关注。
复制链接 扫一扫
分享
为您搜索到以下结果:
9,341
社区成员
552
社区内容





YOLO
YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的约瑟夫-雷德蒙(Joseph Redmon)和阿里-法哈迪(Ali Farhadi)开发。YOLO 于
复制链接 扫一扫

确定
社区描述
YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的约瑟夫-雷德蒙(Joseph Redmon)和阿里-法哈迪(Ali Farhadi)开发。YOLO 于 YOLO目标检测 个人社区 上海·浦东新区
加入社区
获取链接或二维码
- 近7日
- 近30日
- 至今
加载中
社区公告
【社区规则】学习优先,其他靠边!
【多多发帖】本社区发帖,链接到自己的博文,官方会多给曝光,同时粉丝多涨涨!!!
【发帖内容】 发帖可以是求助,也可以是文章,
当然也可以是链接你自己博文的帖子,总是对你有益的都可以。
(违反官方规定的不可以)
有问题,可以私聊我,同时头部和侧边栏也有我的联系方式!!!