【斯坦福CS224N硬核课】如何融合知识到语言模型中，60页ppt - 专知VIP

会员服务 ·

1

语言模型 · 自然语言处理 ·

2021 年 3 月 8 日

【斯坦福CS224N硬核课】如何融合知识到语言模型中，60页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

以ELMO (Peters et al.， 2018)、GPT (Radford et al.， 2018)和BERT (Devlin et al.， 2019)为代表的预训练语言模型受到了广泛关注，并提出了大量的变体模型。在这些研究中，一些研究人员致力于将知识引入语言模型(Levine et al., 2019; Lauscher et al., 2019; Liu et al., 2019; Zhang et al., 2019b)。ERNIE-Baidu (Sun et al.， 2019)引入新的掩蔽单元，如短语和实体，在这些掩蔽单元中学习知识信息。作为奖励，来自短语和实体的语法和语义信息被隐式地集成到语言模型中。此外，ERNIE-Tsinghua (Zhang et al.， 2019a)探索了一种不同的知识信息，将知识图谱整合到BERT中，同时学习词汇、句法和知识信息。Xiong et al. (2019) 将实体替换检查任务引入到预先训练的语言模型中，并改进若干与实体相关的下游任务，如问答和实体类型。Wang et al.(2020)提出了一种将知识注入语言模型的插件方式，他们的方法将不同种类的知识保存在不同的适配器中。这些方法所引入的知识信息并没有很重视KG中图表化的知识。

http://web.stanford.edu/class/cs224n/index.html#schedule

成为VIP会员查看完整内容

61

相关内容

语言模型

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

专知会员服务

74+阅读 · 2021年2月23日

【斯坦福CS224N硬核课】自然语言生成NLG，79页ppt

专知会员服务

37+阅读 · 2021年2月22日

【斯坦福CS224W】知识图谱推理，84页ppt

【斯坦福CS224W】知识图谱推理，84页ppt

专知会员服务

122+阅读 · 2021年2月19日

【斯坦福CS224N硬核课】Transformers模型详解，50页ppt

专知会员服务

61+阅读 · 2021年2月16日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

只知道CS224N？斯坦福最新推出NLU公开课CS224U

只知道CS224N？斯坦福最新推出NLU公开课CS224U

机器之心

3+阅读 · 2019年6月20日

CS224N 2019最全20视频分享：斯坦福大学深度学习自然语言处理课程资源索引

CS224N 2019最全20视频分享：斯坦福大学深度学习自然语言处理课程资源索引

AINLP

12+阅读 · 2019年4月21日

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

专知

12+阅读 · 2019年1月6日

深度上下文词向量

深度上下文词向量

微信AI

27+阅读 · 2018年9月13日

A Dynamic Architecture for Task Assignment and Scheduling for Collaborative Robotic Cells

A Dynamic Architecture for Task Assignment and Scheduling for Collaborative Robotic Cells

Arxiv

0+阅读 · 2021年4月29日

Actionable Models: Unsupervised Offline Reinforcement Learning of Robotic Skills

Arxiv

0+阅读 · 2021年4月28日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

VIP会员

相关主题

自然语言处理

相关VIP内容

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

专知会员服务

74+阅读 · 2021年2月23日

【斯坦福CS224N硬核课】自然语言生成NLG，79页ppt

专知会员服务

37+阅读 · 2021年2月22日

【斯坦福CS224W】知识图谱推理，84页ppt

【斯坦福CS224W】知识图谱推理，84页ppt

专知会员服务

122+阅读 · 2021年2月19日

【斯坦福CS224N硬核课】Transformers模型详解，50页ppt

专知会员服务

61+阅读 · 2021年2月16日

热门VIP内容

开通专知VIP会员享更多权益服务

前沿人工智能趋势报告（Frontier AI Trends Report）

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

音退化问题：基于输入操控的鲁棒语音转换综述

相关资讯

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

只知道CS224N？斯坦福最新推出NLU公开课CS224U

只知道CS224N？斯坦福最新推出NLU公开课CS224U

机器之心

3+阅读 · 2019年6月20日

CS224N 2019最全20视频分享：斯坦福大学深度学习自然语言处理课程资源索引

CS224N 2019最全20视频分享：斯坦福大学深度学习自然语言处理课程资源索引

AINLP

12+阅读 · 2019年4月21日

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

专知

12+阅读 · 2019年1月6日

深度上下文词向量

深度上下文词向量

微信AI

27+阅读 · 2018年9月13日

相关论文

A Dynamic Architecture for Task Assignment and Scheduling for Collaborative Robotic Cells

A Dynamic Architecture for Task Assignment and Scheduling for Collaborative Robotic Cells

Arxiv

0+阅读 · 2021年4月29日

Actionable Models: Unsupervised Offline Reinforcement Learning of Robotic Skills

Arxiv

0+阅读 · 2021年4月28日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

微信扫码咨询专知VIP会员