The 2025 BEHAVIOR Challenge is designed to rigorously track progress toward solving long-horizon tasks by physical agents in simulated environments. BEHAVIOR-1K focuses on everyday household tasks that people most want robots to assist with and these tasks introduce long-horizon mobile manipulation challenges in realistic settings, bridging the gap between current research and real-world, human-centric applications. This report presents our solution to the 2025 BEHAVIOR Challenge in a very close 2nd place and substantially outperforms the rest of the submissions. Building on $π_{0.5}$, we focus on systematically building our solution by studying the effects of training techniques and data. Through careful ablations, we show the scaling power in pre-training and post-training phases for competitive performance. We summarize our practical lessons and design recommendations that we hope will provide actionable insights for the broader embodied AI community when adapting powerful foundation models to complex embodied scenarios.


翻译:2025年BEHAVIOR挑战赛旨在严格追踪物理智能体在模拟环境中解决长时程任务的进展。BEHAVIOR-1K专注于人们最期望机器人协助的日常家庭任务,这些任务在真实场景中引入了长时程移动操作挑战,从而弥合了当前研究与现实世界、以人为中心的应用之间的差距。本报告介绍了我们在2025年BEHAVIOR挑战赛中获得极接近第二名成绩的解决方案,其性能显著优于其他提交方案。基于$π_{0.5}$,我们通过系统研究训练技术和数据的影响来构建解决方案。通过细致的消融实验,我们展示了预训练与后训练阶段在提升竞争性能方面的扩展能力。我们总结了实践经验和设计建议,期望能为更广泛的具身人工智能社区在将强大基础模型适配至复杂具身场景时提供可操作的见解。

0
下载
关闭预览

相关内容

GANs最新进展,30页ppt,GANs: the story so far
专知会员服务
43+阅读 · 2020年8月2日
Pytorch多模态框架MMF
专知
50+阅读 · 2020年6月20日
预知未来——Gluon 时间序列工具包(GluonTS)
ApacheMXNet
24+阅读 · 2019年6月25日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员