daVinci-Dev: Агентно-орієнтоване проміжне навчання для програмної інженерії

Автори: Ji Zeng, Dayuan Fu, Tiantian Mi, Yumin Zhuang, Yaxing Huang, Xuefeng Li, Lyumanshan Ye, Muhang Xie, Qishuo Hua, Zhen Huang, Mohan Jiang, Hanning Wang, Jifan Lin, Yang Xiao, Jie Sun, Yunze Wu, Pengfei Liu

Опубліковано: 2026-01-26

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття представляє daVinci-Dev, систематичний підхід до проміжного навчання агентів, який наділяє великі мовні моделі (LLM) основними агентними поведінками для програмної інженерії. Він вирішує невідповідність розподілу між статичними навчальними даними та динамічними середовищами розробки за допомогою "агентних даних" (контекстно-рідні траєкторії з запитів на злиття GitHub та екологічно-рідні траєкторії з реальних взаємодій Docker). Це дозволяє LLM автономно навігувати, редагувати та тестувати складні кодові бази, досягаючи найсучасніших показників вирішення на SWE-Bench Verified.