【导读】近几年,深度强化学习(DRL)一直是人工智能取得最大突破的核心。 尽管取得了很多进展,但由于缺乏工具和库,DRL 方法仍难以应用于主流的解决方案。 因此,DRL 主要以研究形式存在,并未在现实世界的机器学习解决方案中得到大量应用。 解决这个问题需要更好的工具和框架。 而在当前的 AI 领域,DeepMind 在推动 DRL 研发方面做了大量工作,包括构建了许多专有工具和框架,以大规模地简化 DRL agent 训练、实验和管理。
最近,DeepMind 又默默开源了三种 DRL 框架:OpenSpiel、SpriteWorld 和 bsuite,用于简化 DRL 应用。
./install.sh
vvirtualenv -p python3 venvsource venv/bin/activatepip3 install -r requirements.txt
./open_spiel/scripts/build_and_run_tests.sh
# For the python modules in open_spiel.export PYTHONPATH=$PYTHONPATH:/<path_to_open_spiel># For the Python bindings of Pyspielexport PYTHONPATH=$PYTHONPATH:/<path_to_open_spiel>/build/python
pip install spriteworld
pip install git + https://github.com/deepmind/spriteworld.git
git clone https://github.com/deepmind/spriteworld.gitpip install spriteworld /
python /path/to/local/spriteworld/run_demo.py
pip install git+git://github.com/deepmind/bsuite.git
pip install bsuite/
pip install -e bsuite /
pip install -e bsuite
import bsuiteenv = bsuite.load_from_id('catch/0')
from bsuite import sweepsweep.SWEEP
sweep.DEEP_SEAsweep.DISCOUNTING_CHAIN
pdflatex bsuite / reports / neurips_2019 / neurips_2019.tex
深度强化学习实验室
算法、框架、资料、前沿信息等
长按二维码关注我们吧
GitHub仓库
https://github.com/NeuronDance/DeepRL
欢迎Fork,Star,Pull Request
微信交流群助手:
NeuronDance
第三篇:深度强化学习框架-OpenSpiel(DeepMind开源28种DRL环境+24种DRL算法实现)