人们对利用强化学习(RL)用于信息检索(IR)应用(包括搜索、推荐和广告)非常感兴趣。仅仅在2020年,术语“强化学习”就在ACM SIGIR发表的60多篇不同的论文中被提到。据报道,谷歌和阿里巴巴等互联网公司已经开始从他们基于RL的搜索和推荐引擎中获得竞争优势。这个全天教程为没有或很少有RL经验的IR研究者和实践者提供了在实际操作设置中学习现代RL基础知识的机会。此外,还将介绍和讨论RL在IR系统中的一些代表性应用。通过参加本教程,学员将获得现代RL概念和标准算法(如REINFORCE和DQN)的良好知识。这些知识将帮助他们更好地理解一些最新的涉及RL的IR出版物,以及他们使用RL技术和工具来解决自己实际的IR问题。

目录内容:

Intro RL Basics Multi-armed Bandits Tabular Q-Learning Deep Q-Learning IR applications using DQN Policy Gradient (REINFORCE) IR applications using REINFORCE Actor-Critic IR applications using Actor-Critic Recent developments & outlook for research

成为VIP会员查看完整内容
28

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【ICML2020】强化学习中基于模型的方法,279页ppt
专知会员服务
48+阅读 · 2020年10月26日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
OpenAI丨深度强化学习关键论文列表
中国人工智能学会
17+阅读 · 2018年11月10日
【OpenAI】深度强化学习关键论文列表
专知
11+阅读 · 2018年11月10日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Arxiv
22+阅读 · 2018年8月30日
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
8+阅读 · 2018年5月15日
VIP会员
相关VIP内容
【ICML2020】强化学习中基于模型的方法,279页ppt
专知会员服务
48+阅读 · 2020年10月26日
深度强化学习策略梯度教程,53页ppt
专知会员服务
184+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
相关资讯
OpenAI丨深度强化学习关键论文列表
中国人工智能学会
17+阅读 · 2018年11月10日
【OpenAI】深度强化学习关键论文列表
专知
11+阅读 · 2018年11月10日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
相关论文
Arxiv
22+阅读 · 2018年8月30日
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
8+阅读 · 2018年5月15日
微信扫码咨询专知VIP会员