【CMU博士论文】大型语言模型的隐性特性 - 专知VIP

会员服务 ·

0

大型语言模型 · 自监督表示学习 · 博士论文 ·

【CMU博士论文】大型语言模型的隐性特性

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大型语言模型（Large Language Models, LLMs）是一类经过训练以理解和生成自然语言的深度学习模型。在我的博士研究期间，LLMs 已经深刻地改变了机器学习领域的格局。如今，它们被广泛应用于众多商业产品中，例如 ChatGPT。此外，从 LLMs 的开发过程中所获得的原理与经验，也持续塑造着机器学习研究的方向——包括尺度规律（scaling laws）与自监督表征学习（self-supervised representation learning）等新范式。然而，这些快速的进展也可能掩盖了许多关于模型内部机制与行为的基础性问题。随着 LLM 能力的不断增强，超越传统训练与评估流程的严谨科学研究变得尤为重要，它对于深入理解与持续改进这些模型至关重要。本论文旨在研究以往被忽视的 “大型语言模型的隐性特性（hidden properties）”。这些隐性特性涉及模型的内部权重空间、激活空间以及输出行为等不同层面。首先，我们发现 LLMs 在其权重空间（weight space）中本质上具有稀疏性（intrinsic sparsity）。为验证这一隐性特征，我们提出了一种基于原理的剪枝方法（principled pruning approach），能够从预训练模型中提取出有效的稀疏子网络。其次，我们进一步探索了激活空间（activation space），揭示了其中存在结构化异常值（structured outliers）。这些激活数量极少，但其绝对值幅度极高。我们称之为**“极大激活（massive activations）”。研究表明，这些激活与自注意力机制（self-attention mechanism）密切相关。针对这一现象，我们提出了一种不含此类异常激活的替代注意力机制**。最后，我们聚焦于输出空间（output space），设计了一个概念上简单的分析框架，用于评估和研究 LLM 生成文本中的特异性（idiosyncrasies）。实验表明，不同模型生成的文本可以被以极高的准确率区分开来，我们进一步分析了导致这种差异的特征性“签名模式（signatures）”。总体而言，本论文希望为现代基础模型（foundation models）提供一种全新的研究视角，以促进对其内部结构与行为机制的深入理解。

成为VIP会员查看完整内容

0

相关内容

大型语言模型

大型语言模型

【斯坦福大学Xiang Lisa Li博士论文】控制语言模型

【斯坦福大学Xiang Lisa Li博士论文】控制语言模型

专知会员服务

19+阅读 · 6月11日

【牛津大学博士论文】构建具有一致性预测的可信语言模型

【牛津大学博士论文】构建具有一致性预测的可信语言模型

专知会员服务

15+阅读 · 4月24日

【MIT博士论文】医学人工智能中的自然语言基础模型

【MIT博士论文】医学人工智能中的自然语言基础模型

专知会员服务

14+阅读 · 4月2日

【伯克利博士论文】语言模型的脆弱性

【伯克利博士论文】语言模型的脆弱性

专知会员服务

22+阅读 · 2月20日

【博士论文】特征学习中的训练与适应理解：从两层网络到基础模型

【博士论文】特征学习中的训练与适应理解：从两层网络到基础模型

专知会员服务

21+阅读 · 2月18日

【阿姆斯特丹博士论文】在语言模型中寻找结构

【阿姆斯特丹博士论文】在语言模型中寻找结构

专知会员服务

25+阅读 · 2024年11月27日

【MIT博士论文】物理启发的生成式模型

【MIT博士论文】物理启发的生成式模型

专知会员服务

25+阅读 · 2024年9月6日

【MIT博士论文】高效深度学习计算的模型加速

【MIT博士论文】高效深度学习计算的模型加速

专知会员服务

34+阅读 · 2024年8月23日

【ETHZ博士论文】利用时间信息：自回归模型中长期依赖性学习的方法

【ETHZ博士论文】利用时间信息：自回归模型中长期依赖性学习的方法

专知会员服务

24+阅读 · 2024年1月2日

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

专知会员服务

69+阅读 · 2021年12月20日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

开放知识图谱

10+阅读 · 2019年10月29日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

专知

23+阅读 · 2019年4月15日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

16+阅读 · 2019年1月24日

MIT&哈佛大学最新综述文章：NLP模型的分析方法

MIT&哈佛大学最新综述文章：NLP模型的分析方法

专知

24+阅读 · 2018年12月26日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

贝叶斯网分解理论及其应用

国家自然科学基金

9+阅读 · 2017年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

Steklov特征值问题的自适应非协调有限元方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

形状记忆凝胶相变-扩散-应力耦合大变形本构关系及其实验验证与数值实现

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

219+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

484+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

151+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

175+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

大型语言模型

自监督表示学习

相关VIP内容

【斯坦福大学Xiang Lisa Li博士论文】控制语言模型

【斯坦福大学Xiang Lisa Li博士论文】控制语言模型

专知会员服务

19+阅读 · 6月11日

【牛津大学博士论文】构建具有一致性预测的可信语言模型

【牛津大学博士论文】构建具有一致性预测的可信语言模型

专知会员服务

15+阅读 · 4月24日

【MIT博士论文】医学人工智能中的自然语言基础模型

【MIT博士论文】医学人工智能中的自然语言基础模型

专知会员服务

14+阅读 · 4月2日

【伯克利博士论文】语言模型的脆弱性

【伯克利博士论文】语言模型的脆弱性

专知会员服务

22+阅读 · 2月20日

【博士论文】特征学习中的训练与适应理解：从两层网络到基础模型

【博士论文】特征学习中的训练与适应理解：从两层网络到基础模型

专知会员服务

21+阅读 · 2月18日

【阿姆斯特丹博士论文】在语言模型中寻找结构

【阿姆斯特丹博士论文】在语言模型中寻找结构

专知会员服务

25+阅读 · 2024年11月27日

【MIT博士论文】物理启发的生成式模型

【MIT博士论文】物理启发的生成式模型

专知会员服务

25+阅读 · 2024年9月6日

【MIT博士论文】高效深度学习计算的模型加速

【MIT博士论文】高效深度学习计算的模型加速

专知会员服务

34+阅读 · 2024年8月23日

【ETHZ博士论文】利用时间信息：自回归模型中长期依赖性学习的方法

【ETHZ博士论文】利用时间信息：自回归模型中长期依赖性学习的方法

专知会员服务

24+阅读 · 2024年1月2日

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

专知会员服务

69+阅读 · 2021年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

面向性能、成本效益、云边隐私与可信性的大小语言模型协作综述

乌克兰太空研究（2022-2024年） | 176页

【CMU博士论文】大型语言模型的隐性特性

国防领域人工智能走向何方？

相关资讯

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

开放知识图谱

10+阅读 · 2019年10月29日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

专知

23+阅读 · 2019年4月15日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

16+阅读 · 2019年1月24日

MIT&哈佛大学最新综述文章：NLP模型的分析方法

MIT&哈佛大学最新综述文章：NLP模型的分析方法

专知

24+阅读 · 2018年12月26日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

相关基金

贝叶斯网分解理论及其应用

国家自然科学基金

9+阅读 · 2017年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

Steklov特征值问题的自适应非协调有限元方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

形状记忆凝胶相变-扩散-应力耦合大变形本构关系及其实验验证与数值实现

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

219+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

484+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

151+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

175+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员