Contrastive Multiview Coding
摘要对于多视角学习,每一个视角都是有噪声并且不完整的,但是重要的信息却被所有的视角共享。所有我们要学习一个强大的模型去学习视角间不变的信息,也就是最大化相同场景但是不同视角的共有信息。我们发现对比损失比交叉预测损失更好,并且学习的视角越多,越能捕获到潜在场景的语义。提出方法预测学习预测学习的目的就是从 v1 预测 v2, 依靠一个中间变量z, 但这会使得 v2 之间的像素互相独立(为什么互相独立?我也不大清楚),失去了学习结构的能力。 两个视角的对比学习 ...