多智能体深度强化学习的若干关键科学问题 - 专知VIP

会员服务 ·

55

多智能体系统 · 深度强化学习 ·

2020 年 5 月 24 日

多智能体深度强化学习的若干关键科学问题

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

摘要: 强化学习作为一种用于解决无模型序列决策问题的方法已经有数十年的历史, 但强化学习方法在处理高维变量问题时常常会面临巨大挑战. 近年来, 深度学习迅猛发展, 使得强化学习方法为复杂高维的多智能体系统提供优化的决策策略、在充满挑战的环境中高效执行目标任务成为可能. 本文综述了强化学习和深度强化学习方法的原理, 提出学习系统的闭环控制框架, 分析了多智能体深度强化学习中存在的若干重要问题和解决方法, 包括多智能体强化学习的算法结构、环境非静态和部分可观性等问题, 对所调查方法的优缺点和相关应用进行分析和讨论. 最后提供多智能体深度强化学习未来的研究方向, 为开发更强大、更易应用的多智能体强化学习控制系统提供一些思路.

成为VIP会员查看完整内容

相关内容

多智能体系统

多智能体系统

多智能体系统(multi-agent system,MAS) 是一种全新的分布式计算技术。自20 世纪70年代出现以来得到迅速发展，目前已经成为一种进行复杂系统分析与模拟的思想方法与工具。

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

189+阅读 · 2020年5月5日

人机对抗智能技术

人机对抗智能技术

专知会员服务

214+阅读 · 2020年5月3日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

121+阅读 · 2020年4月6日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

214+阅读 · 2019年8月30日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

深度强化学习的弱点和局限

深度强化学习的弱点和局限

论智

6+阅读 · 2018年2月27日

深度强化学习的弱点和局限（上）

深度强化学习的弱点和局限（上）

论智

8+阅读 · 2018年2月26日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Efficient Eligibility Traces for Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年10月23日

Paraphrase Generation with Deep Reinforcement Learning

Paraphrase Generation with Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年8月23日

Theme-weighted Ranking of Keywords from Text Documents using Phrase Embeddings

Theme-weighted Ranking of Keywords from Text Documents using Phrase Embeddings

Arxiv

5+阅读 · 2018年7月16日

Deep Reinforcement Learning for List-wise Recommendations

Arxiv

13+阅读 · 2018年1月5日

VIP会员

相关主题

多智能体系统

深度强化学习

相关VIP内容

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

189+阅读 · 2020年5月5日

人机对抗智能技术

人机对抗智能技术

专知会员服务

214+阅读 · 2020年5月3日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

121+阅读 · 2020年4月6日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

214+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】面向真实世界音视联合语音识别的可扩展框架

《通过仿真与开源数据提升战略决策：机遇与局限》最新报告

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

评估大语言模型在科学发现中的作用

相关资讯

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

深度强化学习的弱点和局限

深度强化学习的弱点和局限

论智

6+阅读 · 2018年2月27日

深度强化学习的弱点和局限（上）

深度强化学习的弱点和局限（上）

论智

8+阅读 · 2018年2月26日

相关论文

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Efficient Eligibility Traces for Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年10月23日

Paraphrase Generation with Deep Reinforcement Learning

Paraphrase Generation with Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年8月23日

Theme-weighted Ranking of Keywords from Text Documents using Phrase Embeddings

Theme-weighted Ranking of Keywords from Text Documents using Phrase Embeddings

Arxiv

5+阅读 · 2018年7月16日

Deep Reinforcement Learning for List-wise Recommendations

Arxiv

13+阅读 · 2018年1月5日

微信扫码咨询专知VIP会员