成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
视觉语言模型
关注
5
综合
百科
VIP
热门
动态
论文
精华
SpaceDrive: Infusing Spatial Awareness into VLM-based Autonomous Driving
Arxiv
0+阅读 · 12月11日
PerTouch: VLM-Driven Agent for Personalized and Semantic Image Retouching
Arxiv
0+阅读 · 12月17日
Multilingual VLM Training: Adapting an English-Trained VLM to French
Arxiv
0+阅读 · 12月11日
Do Vision-Language Models See Visualizations Like Humans? Alignment in Chart Categorization
Arxiv
0+阅读 · 11月7日
IPR-1: Interactive Physical Reasoner
Arxiv
0+阅读 · 11月19日
Leveraging NTPs for Efficient Hallucination Detection in VLMs
Arxiv
0+阅读 · 11月14日
Image Complexity-Aware Adaptive Retrieval for Efficient Vision-Language Models
Arxiv
0+阅读 · 12月17日
Concept-Guided Backdoor Attack on Vision Language Models
Arxiv
0+阅读 · 11月30日
Concept-Guided Backdoor Attack on Vision Language Models
Arxiv
0+阅读 · 12月5日
Vision Language Models Can Parse Floor Plan Maps
Arxiv
0+阅读 · 11月24日
CLIP-S$^4$: Language-Guided Self-Supervised Semantic Segmentation
Arxiv
0+阅读 · 2023年5月1日
Exploiting Category Names for Few-Shot Classification with Vision-Language Models
Arxiv
0+阅读 · 2023年4月18日
Grounding Classical Task Planners via Vision-Language Models
Arxiv
0+阅读 · 2023年4月17日
Chain of Thought Prompt Tuning in Vision Language Models
Arxiv
7+阅读 · 2023年4月16日
Towards Robust Prompts on Vision-Language Models
Arxiv
0+阅读 · 2023年4月17日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top