WorldPlay: На шляху до довгострокової геометричної узгодженості для інтерактивного моделювання світу в реальному часі
Автори: Wenqiang Sun, Haiyu Zhang, Haoyuan Wang, Junta Wu, Zehan Wang, Zhenwei Wang, Yunhong Wang, Jun Zhang, Tengfei Wang, Chunchao Guo
Опубліковано: 2025-12-17
Переглянути на arXiv →Анотація
Ця стаття представляє WorldPlay, потокову модель дифузії відео, яка дозволяє моделювати світ у реальному часі з довгостроковою геометричною узгодженістю. Вона вирішує компроміс між швидкістю та пам'яттю за допомогою таких інновацій, як подвійне представлення дії, відновлена контекстна пам'ять та примусовий контекст, генеруючи потокове відео 720p з довгим горизонтом зі швидкістю 24 FPS з чудовою узгодженістю та сильною узагальненістю в різних сценах.