DEiT实战:使用DEiT实现图像分类任务(二)
训练的主要步骤:1、使用AverageMeter保存自定义变量,包括loss,ACC1,ACC5。2、判断迭代的数据是否是奇数,由于mixup_fn只能接受偶数,所以如果不是偶数则要减去一位,让其变成偶数。但是有可能最后一次迭代只有一条数据,减去后就变成了0,所以还要判断不能小于2,如果小于2则直接中断本次循环。3、将数据输入mixup_fn生成mixup数据,然后输入model计算loss。4、 optimizer.zero_grad() 梯度清零,把loss关于weight的导数变成0。