Cosmos Policy: Точне налаштування відеомоделей для візуомоторного контролю та планування
Автори: Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, Yen-Chen Lin, Yunhao Ge, Grace Lam, Percy Liang, Shuran Song, Ming-Yu Liu, Chelsea Finn, Jinwei Gu
Опубліковано: 2026-01-23
Переглянути на arXiv →Анотація
Ця стаття представляє Cosmos Policy, метод точного налаштування великих, попередньо навчених латентних моделей дифузії відео в єдині політики роботів для візуомоторного контролю та планування. Він досягає найсучасніших показників успішності у складних маніпуляційних завданнях на різних еталонних тестах, демонструючи підвищену ефективність даних та надійність. Цей підхід має значний потенціал для розвитку робототехніки та втіленого ШІ, дозволяючи роботам ефективніше виконувати складні завдання в реальному світі.