蒙特卡罗树搜索是一种游戏树搜索算法,其最著名的应用是AlphaGo。我将给出一个关于这个算法的教程,其中将包含Python中一个重要的实用组件。对Python和Numpy非常基本的了解对于希望独立完成实用组件的学生来说是很有用的。

https://rl-vs.github.io/rlvs2021/mcts.html

成为VIP会员查看完整内容
59

相关内容

【DeepMind】强化学习教程,83页ppt
专知会员服务
158+阅读 · 2020年8月7日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
181+阅读 · 2020年5月29日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
124+阅读 · 2020年1月15日
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
Arxiv
0+阅读 · 2021年5月30日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
3+阅读 · 2017年11月20日
VIP会员
相关VIP内容
【DeepMind】强化学习教程,83页ppt
专知会员服务
158+阅读 · 2020年8月7日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
181+阅读 · 2020年5月29日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
124+阅读 · 2020年1月15日
相关论文
Arxiv
0+阅读 · 2021年5月30日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
3+阅读 · 2017年11月20日
微信扫码咨询专知VIP会员