概率变换器 (Probabilistic Transformers)

We show that Transformers are Maximum Posterior Probability estimators for Mixtures of Gaussian Models. This brings a probabilistic point of view to Transformers and suggests extensions to other probabilistic cases.

翻译：我们显示,变换器是高山模型混合体的最大外在概率估计器。这给变换器带来一个概率观点, 并提示其他概率案例的扩展。

相关内容

变换

关注 2

Transformer文本分类代码

专知会员服务

118+阅读 · 2020年2月3日

【斯坦福大学AAAI2020】跨越因果层次的概率推理，Probabilistic Reasoning across the Causal Hierarchy

专知会员服务

46+阅读 · 2020年1月11日

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

专知会员服务

104+阅读 · 2019年12月30日

经典书《机器学习：概率视角》（Machine Learning: a Probabilistic Perspective）第二版Python代码，附1098页pdf下载

专知会员服务

277+阅读 · 2019年10月25日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

NIPS 2017：贝叶斯深度学习与深度贝叶斯学习（讲义+视频）

机器学习研究会

36+阅读 · 2017年12月10日

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

自然语言处理 (NLP)资源大全

机械鸡

35+阅读 · 2017年9月17日

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

Probabilistic Conditional System Invariant Generation with Bayesian Inference

Arxiv

0+阅读 · 2020年12月11日

Probabilistic Tracklet Scoring and Inpainting for Multiple Object Tracking

Arxiv

0+阅读 · 2020年12月10日

Low-rank matrix estimation in multi-response regression with measurement errors: Statistical and computational guarantees

Arxiv

0+阅读 · 2020年12月10日

Inference in Probabilistic Graphical Models by Graph Neural Networks

Arxiv

3+阅读 · 2018年5月25日

TensorLog: Deep Learning Meets Probabilistic DBs

Arxiv

6+阅读 · 2017年7月17日

VIP会员

文章信息

前往arXiv

下载PDF

相关VIP内容

Transformer文本分类代码

专知会员服务

118+阅读 · 2020年2月3日

【斯坦福大学AAAI2020】跨越因果层次的概率推理，Probabilistic Reasoning across the Causal Hierarchy

专知会员服务

46+阅读 · 2020年1月11日

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

专知会员服务

104+阅读 · 2019年12月30日

经典书《机器学习：概率视角》（Machine Learning: a Probabilistic Perspective）第二版Python代码，附1098页pdf下载

专知会员服务

277+阅读 · 2019年10月25日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】面向真实世界音视联合语音识别的可扩展框架

《通过仿真与开源数据提升战略决策：机遇与局限》最新报告

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

评估大语言模型在科学发现中的作用