现代自适应控制与强化学习，166页pdf - 专知VIP

会员服务 ·

61

自适应控制 · 强化学习 · 书籍 ·

2022 年 8 月 30 日

现代自适应控制与强化学习，166页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

这本书是对卡内基梅隆大学Drew Bagnell在自适应控制和强化学习课程(2010,11,14)，Byron Boots在佐治亚理工大学(2019)和Sanjiban Choudhury在康奈尔大学(2022)所做课堂笔记的编辑合集。我们感谢Chris Atkeson共同讲授了这门课的第一个实例，并塑造了我们在这里思考问题的方式。这本书——以及它所依据的类——旨在提供一套实用工具，为机器与世界的交互构建决策程序。我们的应用程序从视频游戏和网络搜索到机器人操作和自动驾驶汽车。这个领域是广阔的，所以我们的观点必然是狭隘的。我们明确地不做严格的尝试，而是专注于直觉和建立这种直觉的非正式数学论证，以及我们在艰难的决策问题上多次看到的技术。我们试图概括出我们在实践中最有可能采用的技术和思维方式。在整个过程中，我们试图指出严格的衍生和原始文献的主题。这些笔记的设计基于概率的基本技术(条件概率、条件独立、高斯、积分技术、贝叶斯方法和推断、滤波和时间序列模型)、线性代数(计算和基本线性分析)、优化(梯度、Hessians、度量、Krylov子空间)和机器学习(泛化、优化、无后悔/在线学习、反向传播和核方法)。

成为VIP会员查看完整内容

相关内容

自适应控制

自适应控制

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知会员服务

93+阅读 · 2022年9月16日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

150+阅读 · 2022年6月9日

【经典书】强化学习算法，98页pdf

专知会员服务

130+阅读 · 2021年8月25日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知

12+阅读 · 2022年9月16日

【CMU硬核书】现代自适应控制与强化学习，166页pdf

【CMU硬核书】现代自适应控制与强化学习，166页pdf

专知

4+阅读 · 2022年8月30日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

【2020新书】程序员数学基础, 692页pdf，用Python实现3D图形、机器学习和仿真

【2020新书】程序员数学基础, 692页pdf，用Python实现3D图形、机器学习和仿真

专知

52+阅读 · 2020年12月4日

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

产业智能官

18+阅读 · 2019年1月1日

基于动态规划粘性解及特征正交分解降维方法的偏微分方程最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

基于随机凸优化算法的不确定跳变系统概率控制

国家自然科学基金

0+阅读 · 2013年12月31日

多元极值理论及其在风险理论中的应用

国家自然科学基金

0+阅读 · 2013年12月31日

对偶自适应控制问题研究

国家自然科学基金

0+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

Online matching with delays and stochastic arrival times

Arxiv

1+阅读 · 2022年10月13日

Online PAC-Bayes Learning

Arxiv

1+阅读 · 2022年10月13日

Partial Information as Full: Reward Imputation with Sketching in Bandits

Arxiv

0+阅读 · 2022年10月13日

Real World Offline Reinforcement Learning with Realistic Data Source

Arxiv

0+阅读 · 2022年10月12日

Matrix Decomposition and Applications

Arxiv

54+阅读 · 2022年1月1日

VIP会员

相关主题

自适应控制

相关VIP内容

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知会员服务

93+阅读 · 2022年9月16日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

150+阅读 · 2022年6月9日

【经典书】强化学习算法，98页pdf

专知会员服务

130+阅读 · 2021年8月25日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知

12+阅读 · 2022年9月16日

【CMU硬核书】现代自适应控制与强化学习，166页pdf

【CMU硬核书】现代自适应控制与强化学习，166页pdf

专知

4+阅读 · 2022年8月30日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

【2020新书】程序员数学基础, 692页pdf，用Python实现3D图形、机器学习和仿真

【2020新书】程序员数学基础, 692页pdf，用Python实现3D图形、机器学习和仿真

专知

52+阅读 · 2020年12月4日

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

产业智能官

18+阅读 · 2019年1月1日

相关基金

基于动态规划粘性解及特征正交分解降维方法的偏微分方程最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

基于随机凸优化算法的不确定跳变系统概率控制

国家自然科学基金

0+阅读 · 2013年12月31日

多元极值理论及其在风险理论中的应用

国家自然科学基金

0+阅读 · 2013年12月31日

对偶自适应控制问题研究

国家自然科学基金

0+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

相关论文

Online matching with delays and stochastic arrival times

Arxiv

1+阅读 · 2022年10月13日

Online PAC-Bayes Learning

Arxiv

1+阅读 · 2022年10月13日

Partial Information as Full: Reward Imputation with Sketching in Bandits

Arxiv

0+阅读 · 2022年10月13日

Real World Offline Reinforcement Learning with Realistic Data Source

Arxiv

0+阅读 · 2022年10月12日

Matrix Decomposition and Applications

Arxiv

54+阅读 · 2022年1月1日

微信扫码咨询专知VIP会员