DreamDojo: Загальна модель світу робота з великомасштабних відео з людьми
Автори: Shenyuan Gao, William Liang, Kaiyuan Zheng, Ayaan Malik, Seonghyeon Ye, Sihyun Yu, Wei-Cheng Tseng, Yuzhu Dong, Kaichun Mo, Chen-Hsuan Lin, Qianli Ma, Seungjun Nah, Loic Magne, Jiannan Xiang, Yuqi Xie, Ruijie Zheng, Dantong Niu, You Liang Tan, K.R. Zentner, George Kurian
Опубліковано: 2026-02-09
Переглянути на arXiv →Анотація
DreamDojo представляє узагальнену модель світу робота, вивчену на основі великомасштабних відео з людьми, що дозволяє ефективно навчати роботів з підкріпленням. Ця структура співрозвиває відео-модель світу та політику VLA, значно покращуючи здатність роботів розуміти та взаємодіяти з різноманітними середовищами, відкриваючи шлях для більш адаптованих та універсальних роботизованих застосувань.