LongVie 2: Мультимодальна керована наддовга відео-модель світу
Автори: Jianxiong Gao, Zhaoxi Chen, Xian Liu, Junhao Zhuang, Chengming Xu, Jianfeng Feng, Yu Qiao, Yanwei Fu, Chenyang Si, Ziwei Liu
Опубліковано: 2025-12-16
Переглянути на arXiv →Анотація
Ця стаття представляє LongVie 2, мультимодальну керовану наддовгу відео-модель світу. Вона зосереджена на генерації та розумінні розширених відеопослідовностей з високою точністю та керованістю. Це дослідження має значні реальні застосування в таких областях, як створення відеоконтенту, реалістичні симуляційні середовища та розширена взаємодія людини з комп'ютером, розширюючи межі генеративного ШІ для відео.