南大本科生NeurIPS论文！俞扬团队首次揭示强化学习「记忆池」最优利用方法

记忆池」是深度强化学习的基本部件，但多年以来如何最优利用记忆池仍然未知。

在刚刚闭幕的机器学习国际顶级会议NeurIPS 2021上，南京大学人工智能学院独立完成的工作「Regret Minimization Experience Replay in Off-Policy Reinforcement Learning」，首次揭示了深度强化学习「记忆池」的最优利用方法。

https://openreview.net/forum?id=5AixAJweEyC

该工作由俞扬教授指导，其共同第一作者，2018级本科生薛正海，是南大人工智能学院的首届本科生。

成为VIP会员查看完整内容

相关内容

NeurIPS 2021

关注 5

多智能体深度强化学习：综述

专知会员服务

170+阅读 · 2021年8月3日

近期必读的五篇 NeurIPS 2020【元学习】相关论文

专知会员服务

28+阅读 · 2020年12月15日

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

专知会员服务

15+阅读 · 2020年7月15日

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

专知会员服务

65+阅读 · 2019年10月9日

ICLR 2020 高质量强化学习论文汇总

极市平台

12+阅读 · 2019年11月11日

逆强化学习几篇论文笔记

CreateAMind

9+阅读 · 2018年12月13日

OpenAI官方发布：强化学习中的关键论文

专知

14+阅读 · 2018年12月12日

高考状元出身的“80”后科学家，入选国家杰青，两年发四篇Nature

德先生

4+阅读 · 2018年6月6日

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

Return-Based Contrastive Representation Learning for Reinforcement Learning

Arxiv

10+阅读 · 2021年2月22日

Information-Directed Exploration for Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年12月18日

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Do deep reinforcement learning agents model intentions?

Arxiv

5+阅读 · 2018年5月21日

Eigenoption Discovery through the Deep Successor Representation

Arxiv

3+阅读 · 2018年1月30日

VIP会员