记忆池」是深度强化学习的基本部件,但多年以来如何最优利用记忆池仍然未知。

在刚刚闭幕的机器学习国际顶级会议NeurIPS 2021上,南京大学人工智能学院独立完成的工作「Regret Minimization Experience Replay in Off-Policy Reinforcement Learning」,首次揭示了深度强化学习「记忆池」的最优利用方法。

https://openreview.net/forum?id=5AixAJweEyC

该工作由俞扬教授指导,其共同第一作者,2018级本科生薛正海,是南大人工智能学院的首届本科生。

成为VIP会员查看完整内容
25

相关内容

专知会员服务
170+阅读 · 2021年8月3日
专知会员服务
28+阅读 · 2020年12月15日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
ICLR 2020 高质量强化学习论文汇总
极市平台
12+阅读 · 2019年11月11日
逆强化学习几篇论文笔记
CreateAMind
9+阅读 · 2018年12月13日
OpenAI官方发布:强化学习中的关键论文
专知
14+阅读 · 2018年12月12日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
VIP会员
相关VIP内容
专知会员服务
170+阅读 · 2021年8月3日
专知会员服务
28+阅读 · 2020年12月15日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
相关资讯
ICLR 2020 高质量强化学习论文汇总
极市平台
12+阅读 · 2019年11月11日
逆强化学习几篇论文笔记
CreateAMind
9+阅读 · 2018年12月13日
OpenAI官方发布:强化学习中的关键论文
专知
14+阅读 · 2018年12月12日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
微信扫码咨询专知VIP会员