成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
强化微调
关注
1
综合
百科
VIP
热门
动态
论文
精华
iTool: Reinforced Fine-Tuning with Dynamic Deficiency Calibration for Advanced Tool Use
Arxiv
0+阅读 · 11月7日
Learning to Refuse: Refusal-Aware Reinforcement Fine-Tuning for Hard-Irrelevant Queries in Video Temporal Grounding
Arxiv
0+阅读 · 11月28日
Towards Adaptive Humanoid Control via Multi-Behavior Distillation and Reinforced Fine-Tuning
Arxiv
0+阅读 · 11月9日
Thinking With Bounding Boxes: Enhancing Spatio-Temporal Video Grounding via Reinforcement Fine-Tuning
Arxiv
0+阅读 · 11月26日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top