SWE-Universe: Масштабування реальних перевіряємих середовищ до мільйонів

Автори: Mouxiang Chen, Lei Zhang, Yunlong Feng, Yiheng Li, Xiao Sun, Jindong Wang, Fei Xia, Changtai Li, Rui Zhang, Wenbo Li, Tianyu Pang, Xianfeng Wen, Dongchen Jiang, Ziyue Li, Zhigang Zeng

Опубліковано: 2026-02-02

Переглянути на arXiv →
#cs.AI

Анотація

SWE-Universe — це фреймворк, розроблений для автоматичного створення понад 800 000 реальних, багатомовних, перевіряємих середовищ розробки програмного забезпечення з GitHub PR. Цей масивний набір даних значно розширює можливості агентів кодування, при цьому модель Qwen3-Max-Thinking досягає 75,3% точності на SWE-Bench Verified та значних покращень на багатомовних бенчмарках.

SWE-Universe: Масштабування реальних перевіряємих середовищ до мільйонів

Автори: Mouxiang Chen, Lei Zhang, Yunlong Feng, Yiheng Li, Xiao Sun, Jindong Wang, Fei Xia, Changtai Li, Rui Zhang, Wenbo Li, Tianyu Pang, Xianfeng Wen, Dongchen Jiang, Ziyue Li, Zhigang Zeng

Опубліковано: 2026-02-02

Переглянути на arXiv →
#cs.AI

Анотація

SWE-Universe — це фреймворк, розроблений для автоматичного створення понад 800 000 реальних, багатомовних, перевіряємих середовищ розробки програмного забезпечення з GitHub PR. Цей масивний набір даних значно розширює можливості агентів кодування, при цьому модель Qwen3-Max-Thinking досягає 75,3% точності на SWE-Bench Verified та значних покращень на багатомовних бенчмарках.

FEEDBACK

Проекти

Немає проектів

SWE-Universe: Масштабування реальних перевіряємих середовищ до мільйонів | ArXiv Intelligence