使用大的训练样本反而对网络在训练过程中的准确性造成负面影响,这改如何解决?
应该主要是由于大样本破坏了梯度下降的随机性导致的,尽可能小的缩减你的样本尺寸。在训练时可以最大化利用GPU并行性。此外更大的样本需要更多训练周期才能达到相同的准确度。最好使用较小的样本(16、8、1)。
2,851
社区成员
5,758
社区内容
加载中
试试用AI创作助手写篇文章吧