深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法,详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理,并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后,对深度强化学习的算法和应用进行展望,针对一些未来的研究方向和研究热点给出了建议。

成为VIP会员查看完整内容
138

相关内容

人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支。
专知会员服务
140+阅读 · 2021年2月17日
深度强化学习在智能制造中的应用展望综述
专知会员服务
98+阅读 · 2021年1月28日
专知会员服务
114+阅读 · 2020年12月31日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
157+阅读 · 2020年9月20日
专知会员服务
214+阅读 · 2019年8月30日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
「中文文献」目标跟踪算法综述
专知
3+阅读 · 2019年7月25日
Arxiv
24+阅读 · 2021年1月25日
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关VIP内容
专知会员服务
140+阅读 · 2021年2月17日
深度强化学习在智能制造中的应用展望综述
专知会员服务
98+阅读 · 2021年1月28日
专知会员服务
114+阅读 · 2020年12月31日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
157+阅读 · 2020年9月20日
专知会员服务
214+阅读 · 2019年8月30日
相关资讯
相关论文
Arxiv
24+阅读 · 2021年1月25日
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
11+阅读 · 2018年4月25日
微信扫码咨询专知VIP会员