社区
《零基础学机器学习》
代码
帖子详情
第11课 强化学习实战——咖哥的冰湖挑战
零基础学机器学习
2022-01-04 13:49:33
11.1 问题定义:帮助智能体完成冰湖挑战
代码:
11.1 问题定义:帮助智能体完成冰湖挑战|code_1.py
11.4 用Q-Learning算法来解决冰湖挑战问题
代码:
11.4 用Q-Learning算法来解决冰湖挑战问题|code_1.py
代码:
11.4 用Q-Learning算法来解决冰湖挑战问题|code_2.py
代码:
11.4 用Q-Learning算法来解决冰湖挑战问题|code_3.py
代码:
11.4 用Q-Learning算法来解决冰湖挑战问题|code_4.py
代码:
11.4 用Q-Learning算法来解决冰湖挑战问题|code_5.py
代码:
11.4 用Q-Learning算法来解决冰湖挑战问题|code_6.py
代码:
11.4 用Q-Learning算法来解决冰湖挑战问题|code_7.py
代码:
11.4 用Q-Learning算法来解决冰湖挑战问题|code_8.py
11.6 用SARSA算法来解决冰湖挑战问题
代码:
11.6 用SARSA算法来解决冰湖挑战问题|code_1.py
代码:
11.6 用SARSA算法来解决冰湖挑战问题|code_2.py
...全文
485
回复
打赏
收藏
第11课 强化学习实战——咖哥的冰湖挑战
11.1 问题定义:帮助智能体完成冰湖挑战 代码:11.1 问题定义:帮助智能体完成冰湖挑战|code_1.py 11.4 用Q-Learning算法来解决冰湖挑战问题 代码:11.4 用Q-Learning算法来解决冰湖挑战问题|code_1.py 代码:11.4 用Q-Learning算法来解决冰湖挑战问题|code_2.py 代码:11.4 用Q-Learning算法来解决冰湖挑战问题|code_3.py 代码:11.4 用Q-Learning算法来解决冰湖挑战问题|code_4.py
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
策略的结合——Actor-Critic算法求解
冰湖
游戏
本文介绍用Actor-Critic算法求解
冰湖
游戏。该算法结合策略优化与值函数方法,有单步更新、结合两种方法优点等优势。文中先介绍
冰湖
游戏的创建环境、动作状态等,后搭建Actor-Critic算法架构,用策略梯度和时序差分方法更新网络,智能体在
冰湖
环境表现较好。
从 0 上手
强化学习
:用 Q-Learning 玩
冰湖
游戏,新手也能懂
本文以OpenAI Gym经典环境'FrozenLake-v7'为基础,使用Python实现Q-Learning算法求解。重点涵盖Pygame可视化、Anaconda环境配置、Q表迭代更新机制,并通过修改滑动概率、设gamma=0及分析Q值分布三大实验,直观阐释
强化学习
中环境不确定性、折扣因子作用与价值函数本质等核心技术要点。
强化学习
8——在冰壶环境中使用策略迭代和价值迭代算法
本文介绍了OpenAIGym库中的
冰湖
环境,一个4x4网格游戏,展示了如何使用策略迭代和价值迭代算法寻找最优策略,以及它们在
冰湖
环境中的应用结果。
小白也能学习机器学习吗?从这里开始轻松入门机器学习
本书《零基础学机器学习》采用轻松的故事形式,通过AI新手小冰向资深数据科学家
咖哥
学习,逐步揭秘机器学习。内容涵盖基础原理、数学知识、Python编程、各种机器学习算法
实战
,包括线性回归、逻辑回归、深度学习等,旨在帮助初学者快速上手并应用于实际工作中。全书注重
实战
,案例丰富,适合时间有限的读者快速入门。
学习 :浅谈
强化学习
原理(附代码&链接)
本文通过代码实例深入解析
强化学习
原理,演示如何在
冰湖
环境中运用值迭代和策略迭代算法找到最优策略,实现AI智能体的自我学习。
《零基础学机器学习》
7
社区成员
359
社区内容
发帖
与我相关
我的任务
《零基础学机器学习》
本书的目标,是让非机器学习领域甚至非计算机专业出身但有学习需求的人,轻松地掌握机器学习的基本知识,从而拥有相关的实战能力。
复制链接
扫一扫
分享
社区描述
本书的目标,是让非机器学习领域甚至非计算机专业出身但有学习需求的人,轻松地掌握机器学习的基本知识,从而拥有相关的实战能力。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章