535
社区成员
发帖
与我相关
我的任务
分享
MMPose官方文档:https://mmpose.readthedocs.io/zh_CN/latest/overview.html
目录
Residual Log-likehood Estimation(RLE)(2021)
Part Affinity Field & OpenPose(2016)
Structured Pose Representation(SPR)
Coarse-to-Fine Volumetric Prediction 2017
Percentage of Correct Parts(PCP)
Percentage of Detected Joints(PDJ)
Percentage of Correct Key-points(PCK)
Object Keypoint Similarity(OKS)based mAP

MMPose 是一款基于 Pytorch 的姿态估计开源工具箱,是 OpenMMLab 项目的成员之一,包含了丰富的 2D 多人姿态估计、2D 手部姿态估计、2D 人脸关键点检测、133关键点全身人体姿态估计、动物关键点检测、服饰关键点检测等算法以及相关的组件和模块,下面是它的整体框架:
MMPose 由 8 个主要部分组成:apis、structures、datasets、codecs、models、engine、evaluation 和 visualization。
apis -- 提供用于模型推理的高级 API
structures -- 提供 bbox、keypoint 和 PoseDataSample 等数据结构
datasets -- 支持用于姿态估计的各种数据集
transforms --包含各种数据增强变换
codecs -- 提供姿态编解码器:编码器用于将姿态信息(通常为关键点坐标)编码为模型学习目标(如热力图),解码器则用于将模型输出解码为姿态估计结果
models -- 以模块化结构提供了姿态估计模型的各类组件
pose_estimators -- 定义了所有姿态估计模型类
data_preprocessors -- 用于预处理模型的输入数据
backbones -- 包含各种骨干网络
necks -- 包含各种模型颈部组件
heads -- 包含各种模型头部
losses -- 包含各种损失函数
engine -- 包含与姿态估计任务相关的运行时组件
hooks -- 提供运行时的各种钩子
evaluation -- 提供各种评估模型性能的指标
visualization -- 用于可视化关键点骨架和热力图等信息
从给定的图像中识别人脸、手部、身体等关键点。
输入:图像I
输出:所有关键点的像素坐标(x1,y1),(x2,y2) ... (xj,yj),这里的 j 为关键点的总数,取决于具体的关键点模型

预测人体关键点在三维空间中的坐标,可以在三维空间中还原人体的姿态。

从图像或者视频中恢复出运动的3D人体模型

PoseC3D:基于人体姿态识别行为动作




任务描述
2D 人体姿态估计:在图像上定位人体估计点(通常为人体主要关节)的坐标

基本思路:基于回归(Regression Based)
将关键点检测问题建模成一个回归问题,让模型直接回归关键点的坐标,即![]()

基本思路:基于热力图(Heatmap Based)
并不是直接回归关键点的坐标,而是预测关键点位于每个位置的概论,即![]()
表示关键点在 j 位于(xj,yj)的概率为1,H 称为热力图,尺寸与原图 I 相同或按比例缩小

模型预测热力图比直接回归坐标相对容易,模型精度相对更高,因此主流算法更多基于热力图。但预测热力图的计算消耗大于直接回归。
从数据标注生成热力图

使用热力图训练模型

从热力图还原关键点
1、朴素方法:求热力图最大值位置

2、归一化热力图(Integral Human Pose Regression)



通过级联提升精度

回归方法的优势与劣势


背景知识:回归和最大似然估计的联系



RLE的整体设计

重参数化

残差似然估计

完整的RLE模型


级联 Hourglass 模块

不同的级联和监督方式

Hourglass 模块



HRNet的特征融合方法

HRNet 配合不同任务头



关键点与肢体的预测

关键点与关节预测

肢体定义的关键点亲和度

基于亲和度匹配关键点





网络设计

回归策略

损失函数


PRTR 两阶段算法

PRTR 单节段算法




任务描述

相对坐标 VS 绝对坐标

难点!!!!
3D 人体姿态估计要求从 2D 图像(或视频)恢复 3D 信息
问题:3D 信息从何而来?
思路1:直接预测

思路2:利用视频信息

思路3:利用多视角图像









