71页ppt！指令微调和RLHF讲座(NYU CSCI 2590) 附视频 - 专知VIP

会员服务 ·

25

指令微调 · 人类反馈强化学习 (RLHF) ·

2023 年 5 月 20 日

71页ppt！指令微调和RLHF讲座(NYU CSCI 2590) 附视频

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

我将介绍指令微调和人类反馈的强化学习（RLHF），这些是深度学习技术，为当前一代大型语言模型（如ChatGPT）提供动力。

成为VIP会员查看完整内容

52

相关内容

指令微调

【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》

【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》

专知会员服务

173+阅读 · 2023年4月13日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知会员服务

148+阅读 · 2023年4月7日

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

专知会员服务

188+阅读 · 2023年3月2日

斯坦福大学首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

斯坦福大学首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

专知会员服务

47+阅读 · 2022年7月12日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

新智元

5+阅读 · 2022年10月29日

【课程】斯坦福大学CS236：深度生成模型，附课程材料下载

【课程】斯坦福大学CS236：深度生成模型，附课程材料下载

专知

30+阅读 · 2019年9月25日

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

专知

12+阅读 · 2018年2月2日

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

新智元

11+阅读 · 2017年8月16日

乙酰转移酶p300对脂肪酸合成的调控机制及其在前列腺癌治疗中的意义

国家自然科学基金

0+阅读 · 2015年12月31日

多层聚丙交酯共聚物/壳聚糖电纺膜定位负载microRNA的血管再生活性材料

国家自然科学基金

0+阅读 · 2014年12月31日

miR-29b在Ang-II诱导肾小管上皮间充质转分化中的作用

国家自然科学基金

0+阅读 · 2013年12月31日

原子运动神经机理与动力外骨骼的脑机协调控制方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

miR-491通过调控T细胞的增殖和凋亡在诱导T细胞衰竭中的作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

Mixture-of-Experts Meets Instruction Tuning:A Winning Combination for Large Language Models

Arxiv

0+阅读 · 2023年7月5日

From ChatGPT to ThreatGPT: Impact of Generative AI in Cybersecurity and Privacy

Arxiv

0+阅读 · 2023年7月3日

A Juridicidade e a Regulamentação dos Dark Patterns

Arxiv

0+阅读 · 2023年7月1日

Circular Systems Engineering

Arxiv

0+阅读 · 2023年6月30日

Harnessing LLMs in Curricular Design: Using GPT-4 to Support Authoring of Learning Objectives

Arxiv

0+阅读 · 2023年6月30日

VIP会员

相关主题

人类反馈强化学习 (RLHF)

相关VIP内容

【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》

【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》

专知会员服务

173+阅读 · 2023年4月13日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知会员服务

148+阅读 · 2023年4月7日

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

专知会员服务

188+阅读 · 2023年3月2日

斯坦福大学首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

斯坦福大学首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

专知会员服务

47+阅读 · 2022年7月12日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

热门VIP内容

开通专知VIP会员享更多权益服务

前沿人工智能趋势报告（Frontier AI Trends Report）

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

音退化问题：基于输入操控的鲁棒语音转换综述

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

新智元

5+阅读 · 2022年10月29日

【课程】斯坦福大学CS236：深度生成模型，附课程材料下载

【课程】斯坦福大学CS236：深度生成模型，附课程材料下载

专知

30+阅读 · 2019年9月25日

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

专知

12+阅读 · 2018年2月2日

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

新智元

11+阅读 · 2017年8月16日

相关基金

乙酰转移酶p300对脂肪酸合成的调控机制及其在前列腺癌治疗中的意义

国家自然科学基金

0+阅读 · 2015年12月31日

多层聚丙交酯共聚物/壳聚糖电纺膜定位负载microRNA的血管再生活性材料

国家自然科学基金

0+阅读 · 2014年12月31日

miR-29b在Ang-II诱导肾小管上皮间充质转分化中的作用

国家自然科学基金

0+阅读 · 2013年12月31日

原子运动神经机理与动力外骨骼的脑机协调控制方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

miR-491通过调控T细胞的增殖和凋亡在诱导T细胞衰竭中的作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

Mixture-of-Experts Meets Instruction Tuning:A Winning Combination for Large Language Models

Arxiv

0+阅读 · 2023年7月5日

From ChatGPT to ThreatGPT: Impact of Generative AI in Cybersecurity and Privacy

Arxiv

0+阅读 · 2023年7月3日

A Juridicidade e a Regulamentação dos Dark Patterns

Arxiv

0+阅读 · 2023年7月1日

Circular Systems Engineering

Arxiv

0+阅读 · 2023年6月30日

Harnessing LLMs in Curricular Design: Using GPT-4 to Support Authoring of Learning Objectives

Arxiv

0+阅读 · 2023年6月30日

微信扫码咨询专知VIP会员