【论文速递】CVPR2022 - 多少观察才足够?用于轨迹预测的知识蒸馏
准确预测未来的人类位置是现代视频监控系统的一项基本任务。当前最先进的模型通常依赖于过去跟踪位置的“历史记录”(例如,3到5秒)来预测未来位置的合理序列(例如,最多5秒)。由于输入轨迹的收集涉及机器感知(即检测和跟踪),因此在拥挤的场景中可能会累积不正确的检测和碎片错误,从而导致跟踪漂移。在这种情况下,模型将被馈送损坏和嘈杂的输入数据,从而致命地影响其预测性能。在这方面,我们专注于在仅使用少量输入观察时提供准确的预测,从而潜在地降低与自动感知相关的风险。为此,