使用大的训练样本反而对网络在训练过程中的准确性造成负面影响，这改如何解决？

我说你好，猫说喵喵 2022-01-27 10:06:08

使用大的训练样本反而对网络在训练过程中的准确性造成负面影响，这改如何解决？

...全文

2070 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

weixin_38498942 2022-01-27

打赏
举报

回复

应该主要是由于大样本破坏了梯度下降的随机性导致的，尽可能小的缩减你的样本尺寸。在训练时可以最大化利用GPU并行性。此外更大的样本需要更多训练周期才能达到相同的准确度。最好使用较小的样本（16、8、1）。

补充说明一下，不论是径向基（rbf）神经网络还是经典的bp神经网络，都只是具体的训练方法，对于足够多次的迭代，训练结果的准确度是趋于一致的，方法只影响计算的收敛速度（运算时间），和样本规模没有直接关系。补充说明一下，不论是径向基（rbf）神经网络还是经典的bp神经网络，都只是具体的训练方法，对于足够多次的迭代，训练结果的准确度是趋于一致的，方法只影响计算的收敛速度（运算时间），和样本规模没有直接关系。该方法适用于双隐含层网络。2、隐含层神经元数量的选择，不影响性能的前提下，尽量选择小一点的神经元数量。

当训练样本数比较少时，训练效果区别不是很大；但是当训练样本非常大时，神经网络会遗忘最开始训练过的样本（表现在开始训练的样本对权重的影响变小）。

总所周知，在深度学习的训练中，样本的质量和数量都是非常重要的一环。然后在实际的生产过程中，样本的数量往往可以通过一些手段得到满足，但是质量却非常依赖人工的标注，因此往往在训练中会包含一定数量的标注不正确的数据。一般认为这样的一些数据，会对于最终的结果造成负面影响，但是具体怎样影响训练和最终的模型推广效果我们来做一个小实验。实验设置使用工具：MXNET 数据集：MNIST 训练集大小：

总所周知，在深度学习的训练中，样本的质量和数量都是非常重要的一环。然后在实际的生产过程中，样本的数量往往可以通过一些手段得到满足，但是质量却非常依赖人工的标注，因此往往在训练中会包含一定数量的标注不正确的数据。一般认为这样的一些数据，会对于最终的结果造成负面影响，但是具体怎样影响训练和最终的模型推广效果我们来做一个小实验。实验设置使用工具：MXNET数据集：MNIST训练集大小：60000测试集...

1. 什么是类别不平衡问题在机器学习的实践中，我们通常会遇到样本数据中正负样本比例不平衡的情况，也叫数据倾斜。在二分类问题中经常遇到这种情况，如垃圾邮件的分类；在目标检测中，也经常遇到数据不平衡的情况，检测器需要在每张图像中评价一万个到十万个候选位置，然而其中只有很少的点真的含有目标物体。这就导致了训练效率低下和简单的负面样本引发整个模型表现下降的问题。 2.如何解决不平衡问题从数据角度（1...

高通开发者论坛

5,379

社区成员

5,923

社区内容

发帖

与我相关

我的任务

人工智能物联网机器学习技术论坛（原bbs）北京·东城区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章