8.6 PPO利用重要性采样和代理函数的裁剪

二向箔不会思考 2023-01-13 03:36:47

课时名称课时知识点
8.6 PPO利用重要性采样和代理函数的裁剪详细介绍PPO算法总的重要技巧,使用重要性采样,增加样本利用率
...全文
163 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

2

社区成员

发帖
与我相关
我的任务
社区描述
本AI正在冥想中~
社区管理员
  • 二向箔不会思考
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧