成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
40
强化学习
·
最优控制
·
马毅
·
2022 年 4 月 26 日
【伯克利马毅老师】强化学习与最优控制综述
专知会员服务
专知,提供专业可信的知识分发服务,让认知协作更快更好!
来自马毅老师《强化学习与最优控制综述》
成为VIP会员查看完整内容
【Slides】Reinforcement Learning & Optimal Control Overview
点赞并收藏
40
暂时没有读者
76
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
强化学习
关注
5436
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
知识荟萃
精品入门和进阶教程、论文和代码整理等
更多
查看相关VIP内容、论文、资讯等
元强化学习综述及前沿进展
专知会员服务
62+阅读 · 2021年1月31日
2020->2021必看的十篇「深度学习领域综述」论文
专知会员服务
136+阅读 · 2021年1月1日
【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型,90页ppt
专知会员服务
123+阅读 · 2020年9月11日
【伯克利】最新《深度半监督学习》总述,146页ppt,Semi-Supervised Learning
专知会员服务
148+阅读 · 2020年4月11日
【ICCV 2019 Workshop】Complete Dictionary Learning via L4-Norm Maximization over the Orthogonal Grou, 加州大学伯克利分校 马毅
专知会员服务
16+阅读 · 2019年10月31日
荐书|马毅教授7年力作,稀疏模型教科书正式上架,中文版预计明年问世
新智元
4+阅读 · 2022年4月12日
伦敦大学学院、UC伯克利联手,撰文综述深度强化学习泛化研究
机器之心
1+阅读 · 2022年1月3日
【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用,710页pdf
专知
45+阅读 · 2020年12月9日
知识图谱融合方法,140页ppt,南京大学胡伟老师
专知
28+阅读 · 2020年2月19日
【深度学习中文讲义完整版】复旦邱锡鹏老师《神经网络与深度学习》教程分享(附pdf下载)
专知
64+阅读 · 2017年11月20日
信息科学中图与超图划分问题的随机近似算法研究
国家自然科学基金
0+阅读 · 2014年12月31日
视频中事件的内容分析与语义描述
国家自然科学基金
1+阅读 · 2014年12月31日
果蝇生殖干细胞分化调控网络随机动力学研究
国家自然科学基金
0+阅读 · 2013年12月31日
神经网络随机学习算法的泛化性研究
国家自然科学基金
2+阅读 · 2013年12月31日
“原发性开角型青光眼脑功能网络”的研究
国家自然科学基金
0+阅读 · 2011年12月31日
A Regression Tree Method for Longitudinal and Clustered Data with Multivariate Responses
Arxiv
0+阅读 · 2022年6月8日
Boundary between noise and information applied to filtering neural network weight matrices
Arxiv
0+阅读 · 2022年6月8日
Knowledge Augmented Machine Learning with Applications in Autonomous Driving: A Survey
Arxiv
17+阅读 · 2022年5月10日
Optimization for deep learning: theory and algorithms
Arxiv
106+阅读 · 2019年12月19日
Self-Driving Cars: A Survey
Arxiv
41+阅读 · 2019年1月14日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
强化学习
最优控制
马毅
相关VIP内容
元强化学习综述及前沿进展
专知会员服务
62+阅读 · 2021年1月31日
2020->2021必看的十篇「深度学习领域综述」论文
专知会员服务
136+阅读 · 2021年1月1日
【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型,90页ppt
专知会员服务
123+阅读 · 2020年9月11日
【伯克利】最新《深度半监督学习》总述,146页ppt,Semi-Supervised Learning
专知会员服务
148+阅读 · 2020年4月11日
【ICCV 2019 Workshop】Complete Dictionary Learning via L4-Norm Maximization over the Orthogonal Grou, 加州大学伯克利分校 马毅
专知会员服务
16+阅读 · 2019年10月31日
热门VIP内容
开通专知VIP会员 享更多权益服务
人机协同时代的军事指挥控制演进
《英国智库:瓦解俄罗斯防空系统生产,夺回制空权》最新报告
《通过仿真与开源数据提升战略决策:机遇与局限》最新报告
《战术突击工具包:军队的“边缘”操作系统》报告
相关资讯
荐书|马毅教授7年力作,稀疏模型教科书正式上架,中文版预计明年问世
新智元
4+阅读 · 2022年4月12日
伦敦大学学院、UC伯克利联手,撰文综述深度强化学习泛化研究
机器之心
1+阅读 · 2022年1月3日
【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用,710页pdf
专知
45+阅读 · 2020年12月9日
知识图谱融合方法,140页ppt,南京大学胡伟老师
专知
28+阅读 · 2020年2月19日
【深度学习中文讲义完整版】复旦邱锡鹏老师《神经网络与深度学习》教程分享(附pdf下载)
专知
64+阅读 · 2017年11月20日
相关基金
信息科学中图与超图划分问题的随机近似算法研究
国家自然科学基金
0+阅读 · 2014年12月31日
视频中事件的内容分析与语义描述
国家自然科学基金
1+阅读 · 2014年12月31日
果蝇生殖干细胞分化调控网络随机动力学研究
国家自然科学基金
0+阅读 · 2013年12月31日
神经网络随机学习算法的泛化性研究
国家自然科学基金
2+阅读 · 2013年12月31日
“原发性开角型青光眼脑功能网络”的研究
国家自然科学基金
0+阅读 · 2011年12月31日
相关论文
A Regression Tree Method for Longitudinal and Clustered Data with Multivariate Responses
Arxiv
0+阅读 · 2022年6月8日
Boundary between noise and information applied to filtering neural network weight matrices
Arxiv
0+阅读 · 2022年6月8日
Knowledge Augmented Machine Learning with Applications in Autonomous Driving: A Survey
Arxiv
17+阅读 · 2022年5月10日
Optimization for deep learning: theory and algorithms
Arxiv
106+阅读 · 2019年12月19日
Self-Driving Cars: A Survey
Arxiv
41+阅读 · 2019年1月14日
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top