成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
0
逆强化学习几篇论文笔记
2018 年 12 月 13 日
CreateAMind
逆强化学习--无监督学习reward函数
1
2
3
4
登录查看更多
点赞并收藏
0
暂时没有读者
9
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
逆强化学习
关注
6
【Texas 大学】强化学习领域的课程学习:一个框架和综述
专知会员服务
73+阅读 · 2020年3月22日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
176+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放(附下载)
专知会员服务
148+阅读 · 2019年12月25日
MIT新书《强化学习与最优控制》
专知会员服务
282+阅读 · 2019年10月9日
【论文笔记】基于强化学习的人机对话
专知
20+阅读 · 2019年9月21日
【吐血整理】台湾大学李宏毅深度强化学习笔记(49PPT)
新智元
3+阅读 · 2018年7月17日
【干货】强化学习介绍
人工智能学家
13+阅读 · 2018年6月24日
【AlphaGo Zero 核心技术-深度强化学习教程笔记07】策略梯度
专知
7+阅读 · 2017年10月27日
【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测
专知
5+阅读 · 2017年10月23日
Notes on Deep Learning for NLP
Arxiv
22+阅读 · 2018年8月30日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Logically-Constrained Reinforcement Learning
Arxiv
5+阅读 · 2018年4月22日
Learning to Extract Coherent Summary via Deep Reinforcement Learning
Arxiv
6+阅读 · 2018年4月19日
End-to-End Multi-Task Learning with Attention
Arxiv
19+阅读 · 2018年3月28日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
逆强化学习
强化学习
论文
无监督学习
监督学习
无监督
相关VIP内容
【Texas 大学】强化学习领域的课程学习:一个框架和综述
专知会员服务
73+阅读 · 2020年3月22日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
176+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放(附下载)
专知会员服务
148+阅读 · 2019年12月25日
MIT新书《强化学习与最优控制》
专知会员服务
282+阅读 · 2019年10月9日
热门VIP内容
开通专知VIP会员 享更多权益服务
【博士论文】面向真实世界音视联合语音识别的可扩展框架
《通过仿真与开源数据提升战略决策:机遇与局限》最新报告
【AAAI2026】善始则事半功倍:基于前缀优化的大语言模型推理强化学习
评估大语言模型在科学发现中的作用
相关资讯
【论文笔记】基于强化学习的人机对话
专知
20+阅读 · 2019年9月21日
【吐血整理】台湾大学李宏毅深度强化学习笔记(49PPT)
新智元
3+阅读 · 2018年7月17日
【干货】强化学习介绍
人工智能学家
13+阅读 · 2018年6月24日
【AlphaGo Zero 核心技术-深度强化学习教程笔记07】策略梯度
专知
7+阅读 · 2017年10月27日
【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测
专知
5+阅读 · 2017年10月23日
相关论文
Notes on Deep Learning for NLP
Arxiv
22+阅读 · 2018年8月30日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Logically-Constrained Reinforcement Learning
Arxiv
5+阅读 · 2018年4月22日
Learning to Extract Coherent Summary via Deep Reinforcement Learning
Arxiv
6+阅读 · 2018年4月19日
End-to-End Multi-Task Learning with Attention
Arxiv
19+阅读 · 2018年3月28日
大家都在搜
Palantir
蓝牙安全攻防
大型语言模型
多域作战
未来战争
朱克爱德华兹家族
反恐
突防
PINN
【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络(DCRNN)
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top