SGD对于新手来说是不是有些难以调参?
确实有这样的感受,随机梯度下降法(SGD)对于训练深度网络简单高效,但是它有个毛病,就是需要我们人为的去选择参数,比如学习率、参数初始化、权重衰减系数、Drop out比例等。这些参数的选择对训练结果至关重要,以至于我们很多时间都浪费在这些的调参上
2,853
社区成员
5,760
社区内容
加载中
试试用AI创作助手写篇文章吧