SWE-Universe: Масштабування реальних перевіряємих середовищ до мільйонів
Автори: Mouxiang Chen, Lei Zhang, Yunlong Feng, Yiheng Li, Xiao Sun, Jindong Wang, Fei Xia, Changtai Li, Rui Zhang, Wenbo Li, Tianyu Pang, Xianfeng Wen, Dongchen Jiang, Ziyue Li, Zhigang Zeng
Опубліковано: 2026-02-02
Переглянути на arXiv →Анотація
SWE-Universe — це фреймворк, розроблений для автоматичного створення понад 800 000 реальних, багатомовних, перевіряємих середовищ розробки програмного забезпечення з GitHub PR. Цей масивний набір даних значно розширює можливості агентів кодування, при цьому модель Qwen3-Max-Thinking досягає 75,3% точності на SWE-Bench Verified та значних покращень на багатомовних бенчмарках.