LongVie 2: Мультимодальна керована наддовга відео-модель світу

Автори: Jianxiong Gao, Zhaoxi Chen, Xian Liu, Junhao Zhuang, Chengming Xu, Jianfeng Feng, Yu Qiao, Yanwei Fu, Chenyang Si, Ziwei Liu

Опубліковано: 2025-12-16

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття представляє LongVie 2, мультимодальну керовану наддовгу відео-модель світу. Вона зосереджена на генерації та розумінні розширених відеопослідовностей з високою точністю та керованістю. Це дослідження має значні реальні застосування в таких областях, як створення відеоконтенту, реалістичні симуляційні середовища та розширена взаємодія людини з комп'ютером, розширюючи межі генеративного ШІ для відео.

LongVie 2: Мультимодальна керована наддовга відео-модель світу

Автори: Jianxiong Gao, Zhaoxi Chen, Xian Liu, Junhao Zhuang, Chengming Xu, Jianfeng Feng, Yu Qiao, Yanwei Fu, Chenyang Si, Ziwei Liu

Опубліковано: 2025-12-16

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття представляє LongVie 2, мультимодальну керовану наддовгу відео-модель світу. Вона зосереджена на генерації та розумінні розширених відеопослідовностей з високою точністю та керованістю. Це дослідження має значні реальні застосування в таких областях, як створення відеоконтенту, реалістичні симуляційні середовища та розширена взаємодія людини з комп'ютером, розширюючи межі генеративного ШІ для відео.

FEEDBACK

Проекти

Немає проектів

LongVie 2: Мультимодальна керована наддовга відео-модель світу | ArXiv Intelligence