【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习 - 专知VIP

会员服务 ·

0

深度学习 · Transformer · 上下文学习 · 主动测试 ·

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

创建规模日益庞大的数据集在深度学习的实际成功中起到了重要作用。然而，在许多现实场景中，高质量数据可能非常稀缺，导致深度学习的直接应用难以达到预期效果。大量先前研究试图解决这一问题，以提高深度学习的数据效率。这类方法通常依赖于以下一种或多种高级策略：通过调整模型架构或训练方式更有效地利用现有数据；主动控制数据生成过程，以优先获取更有价值的数据；或利用其他间接相关任务的数据。在理想情况下，这些方法可以显著提升深度学习在小数据环境下的表现。但即便如此，深度学习中的数据效率问题仍远未解决，许多挑战依然存在。本论文提出并研究了四种不同的数据高效深度学习方法，通过质疑当前主流方法中的一些默认假设，推动了该领域的最新进展。首先，我们提出了一种名为**非参数 Transformer（Non-Parametric Transformers, NPTs）的数据高效深度学习架构，它将整个数据集作为模型输入。这一做法突破了传统深度学习“单样本输入”的常规，使得 NPT 能够通过直接推理样本之间的交互关系来进行预测。NPT 在小规模结构化数据集（tabular datasets）上表现出色，而这是深度学习方法此前常常表现不佳的领域。其次，我们将数据效率的关注点拓展至模型评估领域。尽管主动学习（active learning）方法可以减少训练过程中所需的标签数量，但评估阶段的标注成本却常被忽视，缺乏合理解释。为此，我们提出了两种不同的方法，通过仅主动标注具有信息量的样本子集，构建出对模型性能的特化估计，从而实现标签高效的模型评估。第三，我们研究了上下文学习（In-Context Learning, ICL）**在大语言模型中学习标签关系的能力。尽管已有大量文献围绕 ICL 是否真正利用标签信息展开讨论，我们的系统研究为这一问题提供了新的视角，揭示了 ICL 在标签学习方面的潜力与局限性。

成为VIP会员查看完整内容

0

相关内容

深度学习

机器学习的一个分支，它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【博士论文】从有限与不完美数据中学习

【博士论文】从有限与不完美数据中学习

专知会员服务

20+阅读 · 7月31日

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

16+阅读 · 3月6日

【博士论文】开放集识别及其在计算机视觉中的应用

【博士论文】开放集识别及其在计算机视觉中的应用

专知会员服务

23+阅读 · 1月16日

【博士论文】基于车载3D LiDAR的几何与语义场景理解深度学习研究

【博士论文】基于车载3D LiDAR的几何与语义场景理解深度学习研究

专知会员服务

19+阅读 · 2024年11月7日

【博士论文】社交与对抗性数据源下的可信机器学习

【博士论文】社交与对抗性数据源下的可信机器学习

专知会员服务

18+阅读 · 2024年8月9日

【博士论文】深度神经网络的元学习损失函数，184页pdf

【博士论文】深度神经网络的元学习损失函数，184页pdf

专知会员服务

19+阅读 · 2024年6月17日

博士论文：领导者-追随者多智能体系统的瞬态控制与时空逻辑任务的应用

博士论文：领导者-追随者多智能体系统的瞬态控制与时空逻辑任务的应用

专知会员服务

46+阅读 · 2023年10月26日

【PSL博士论文】论数据受限环境下机器学习的归纳偏差，112页pdf

【PSL博士论文】论数据受限环境下机器学习的归纳偏差，112页pdf

专知会员服务

40+阅读 · 2023年2月22日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

33+阅读 · 2022年11月25日

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知会员服务

49+阅读 · 2021年12月4日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

37+阅读 · 2023年4月13日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

10+阅读 · 2022年10月15日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【新书】机器学习算法，模型与应用，154页pdf

【新书】机器学习算法，模型与应用，154页pdf

专知

24+阅读 · 2022年1月20日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

15+阅读 · 2020年4月27日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

14+阅读 · 2018年9月20日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于多目标优化的约束模式挖掘方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

41+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

上下文学习

相关VIP内容

【博士论文】从有限与不完美数据中学习

【博士论文】从有限与不完美数据中学习

专知会员服务

20+阅读 · 7月31日

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

16+阅读 · 3月6日

【博士论文】开放集识别及其在计算机视觉中的应用

【博士论文】开放集识别及其在计算机视觉中的应用

专知会员服务

23+阅读 · 1月16日

【博士论文】基于车载3D LiDAR的几何与语义场景理解深度学习研究

【博士论文】基于车载3D LiDAR的几何与语义场景理解深度学习研究

专知会员服务

19+阅读 · 2024年11月7日

【博士论文】社交与对抗性数据源下的可信机器学习

【博士论文】社交与对抗性数据源下的可信机器学习

专知会员服务

18+阅读 · 2024年8月9日

【博士论文】深度神经网络的元学习损失函数，184页pdf

【博士论文】深度神经网络的元学习损失函数，184页pdf

专知会员服务

19+阅读 · 2024年6月17日

博士论文：领导者-追随者多智能体系统的瞬态控制与时空逻辑任务的应用

博士论文：领导者-追随者多智能体系统的瞬态控制与时空逻辑任务的应用

专知会员服务

46+阅读 · 2023年10月26日

【PSL博士论文】论数据受限环境下机器学习的归纳偏差，112页pdf

【PSL博士论文】论数据受限环境下机器学习的归纳偏差，112页pdf

专知会员服务

40+阅读 · 2023年2月22日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

33+阅读 · 2022年11月25日

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知会员服务

49+阅读 · 2021年12月4日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

37+阅读 · 2023年4月13日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

10+阅读 · 2022年10月15日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

【新书】机器学习算法，模型与应用，154页pdf

【新书】机器学习算法，模型与应用，154页pdf

专知

24+阅读 · 2022年1月20日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

15+阅读 · 2020年4月27日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

14+阅读 · 2018年9月20日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于多目标优化的约束模式挖掘方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

41+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员