我的模型具有了良好的范化能力，怎么让这个模型的泛化能力转移到小模型身上去呢

直播小助手2号 2021-12-09 15:55:52

我的模型具有了良好的范化能力，怎么让这个模型的泛化能力转移到小模型身上去呢

...全文

2013 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

weixin_38498942 2021-12-09

打赏
举报

回复

知识蒸馏。
简单地说，知识蒸馏就是把大模型对样本输出的概率向量作为软目标“soft targets”，去让小模型的输出尽量去和这个软目标靠（原来是和One-hot编码上靠）。知识蒸馏过程所用的训练样本可以和训练大模型用的训练样本一样，或者另找一个独立的Transfer集也行。因为“soft targets”比One-hot编码所携带的信息更多，所以我们在训练小模型时可以用比训练大模型时更少的训练集和更大的学习率。

java 验证码识别 ocr java 验证码识别 ocr

1.背景介绍模型泛化能力是指模型在未见过的数据上的表现能力。在人工智能和机器学习领域，泛化能力是衡量模型性能的重要指标。一个好的模型应该在训练数据外的新数据上表现良好，这就需要模型具备泛化能力。在实际应用中，模型泛化能力是关键的，因为我们需要模型能够处理新的、未知的数据。在过去的几年里，随着大数据和深度学习技术的发展，模型泛化能力的重要性得到了广泛认识。然而，提高模型泛化能力仍然是一个具有...

深度学习：模型的泛化能力浅显理解通俗易懂的浅显理解通俗易懂的浅显理解模型的泛化能力通俗易懂的说就是模型在测试集（其中的数据模型以前没有见过）中的表现，也就是模型举一反三的能力，但是这些数据必须满足与iid（独立同分布）并在同一个分布中。举个例子：一张图片模型之前没有见过，但是这张图片与TrainDataSet在同一分布，并满足iid，模型可以很好的预测这张图，这就是模型的泛化，在测试集中，模型预测新数据的准确率越高，就可以说是模型的泛化能力越好。 ...

泛化能力：模型或者分类器对未知新样本分类能力。简单理解就是模型训练之后，对没有进行训练的数据集分类能力。过拟合：过分追求模型对样本集分类的正确性，导致泛化能力下降。简单理解就是在对样本集进行分类的时候，在边界区域难免还有分类错误的情况，是正常的，如果要求模型对样本集几乎接近100%的正确率，反而会造成模型本身对未知样本的分类能力急剧下降，所以模型最好在正确率和泛化能力做好平衡调节，才能优化模型。 ...

模型泛化能力是指模型在未曾见过的数据上的表现能力，也就是模型对于新的数据的适应能力。

高通开发者论坛

4,654

社区成员

5,842

社区内容

发帖

与我相关

我的任务

人工智能物联网机器学习技术论坛（原bbs）北京·东城区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章