E-commerce search engines comprise a retrieval phase and a ranking phase, where the first one returns a candidate product set given user queries. Recently, vision-language pre-training, combining textual information with visual clues, has been popular in the application of retrieval tasks. In this paper, we propose a novel V+L pre-training method to solve the retrieval problem in Taobao Search. We design a visual pre-training task based on contrastive learning, outperforming common regression-based visual pre-training tasks. In addition, we adopt two negative sampling schemes, tailored for the large-scale retrieval task. Besides, we introduce the details of the online deployment of our proposed method in real-world situations. Extensive offline/online experiments demonstrate the superior performance of our method on the retrieval task. Our proposed method is employed as one retrieval channel of Taobao Search and serves hundreds of millions of users in real time.


翻译:电子商务搜索引擎包括检索阶段和排序阶段,其中前者根据用户查询返回候选产品集。最近,结合文本信息和视觉线索的视觉语言预训练在检索任务中应用越来越流行。本文提出了一种新颖的V+L预训练方法,用于解决淘宝搜索中的检索问题。我们设计了一种基于对比学习的视觉预训练任务,优于常见的基于回归的视觉预训练任务。此外,我们采用了两种针对大规模检索任务的负采样方案。此外,我们介绍了我们提出的方法在实际情况下的在线部署细节。广泛的离线/在线实验证明了我们的方法在检索任务上的卓越性能。我们提出的方法被用作淘宝搜索的一个检索通道,并实时为数亿用户提供服务。

0
下载
关闭预览

相关内容

专知会员服务
17+阅读 · 2021年8月24日
最新《Transformers模型》教程,64页ppt
专知会员服务
325+阅读 · 2020年11月26日
【Google论文】ALBERT:自我监督学习语言表达的精简BERT
专知会员服务
24+阅读 · 2019年11月4日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
16+阅读 · 2021年11月27日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员