深度强化学习极简入门与Pytorch实战
社区首页 (3587)




请编写您的帖子内容
社区频道(2)
显示侧栏
卡片版式
深度强化学习极简入门与Pytorch实战
【深度强化学习落地指南】RL环境开发+PPO训练


136
评分
回复


3.5 Numpy计算库使用基础
课时名称课时知识点3.5 Numpy计算库使用基础介绍强大的python计算库Numpy,并介绍其常用的类型和函数
复制链接 扫一扫
分享

141
评分
回复


8.5 PPO如何解决REINFORCE算法的缺点
课时名称课时知识点8.5 PPO如何解决REINFORCE算法的缺点介绍REINFORCE算法存在的问题以及解决方向
复制链接 扫一扫
分享



145
评分
回复


8.8 PPO智能体结构设计和实现
课时名称课时知识点8.8 PPO智能体结构设计和实现详细介绍PPO智能体的设计原理和要点,并使用神经网络建模
复制链接 扫一扫
分享

154
评分
回复


3.6 Matplotlib绘图基础
课时名称课时知识点3.6 Matplotlib绘图基础介绍如何使用Matplotlib进行绘图,掌握论文中精美插图的绘制
复制链接 扫一扫
分享



163
评分
回复


8.6 PPO利用重要性采样和代理函数的裁剪
课时名称课时知识点8.6 PPO利用重要性采样和代理函数的裁剪详细介绍PPO算法总的重要技巧,使用重要性采样,增加样本利用率
复制链接 扫一扫
分享


228
评分
回复


4.3 Gym环境以及二十一点游戏
课时名称课时知识点4.3 Gym环境以及二十一点游戏蒙特卡洛方法部分的编程实战,介绍OpenAI Gym环境和二十一点游戏
复制链接 扫一扫
分享



175
评分
回复


4.2 MC估计价值函数
课时名称课时知识点4.2 MC估计价值函数介绍使用蒙特卡洛估计方法估计价值函数,包含epsilon-greesy策略、Q值表、MC估计、MC增量估计等内容。
复制链接 扫一扫
分享

148
评分
回复


3.3 python中常用于RL的变量类型
课时名称课时知识点3.3 python中常用于RL的变量类型介绍Python中常用于强化学习编程开发中的接种类型数据
复制链接 扫一扫
分享


208
评分
回复


9.4 PPO算法对环境进行学习
课时名称课时知识点9.4 PPO算法对环境进行学习使用spinningUp中的PPO训练智能体学会在网格世界中寻找目标。
复制链接 扫一扫
分享


208
评分
2


7.2 DQN实战-实现月球车着陆
课时名称课时知识点7.2 DQN实战-实现月球车着陆编程实战:实现DQN算法,并使用DQN智能体控制月球车着陆
复制链接 扫一扫
分享
为您搜索到以下结果:
2
社区成员
49
社区内容





枫老师的课程社区_NO_1
本AI正在冥想中~
复制链接 扫一扫

确定
社区描述
本AI正在冥想中~
加入社区
获取链接或二维码
- 近7日
- 近30日
- 至今
加载中
社区公告
暂无公告