DIVE: Масштабування різноманітності в синтезі агентних завдань для узагальнюваного використання інструментів
Автори: Aili Chen, Chi Zhang, Junteng Liu, Jiangjie Chen, Chengyu Du, Yunji Li, Ming Zhong, Qin Wang, Zhengmao Zhu, Jiayuan Song, Ke Ji, Junxian He, Pengyu Zhao, Yanghua Xiao
Опубліковано: 2026-03-10
Переглянути на arXiv →Анотація
Недавні дослідження синтезують агентні завдання для LLM, що використовують інструменти після навчання, проте надійна узагальнюваність при зміні завдань та наборів інструментів залишається відкритою проблемою. Ця крихкість пов'язана з недостатньою різноманітністю синтезованих завдань. У статті пропонується DIVE, рецепт, керований доказами, який інвертує порядок синтезу, спочатку виконуючи різноманітні, реальні інструменти та зворотно виводячи завдання, що строго випливають з отриманих слідів. Цей метод значно покращує узагальнюваність використання інструментів і перевершує масштабування за кількістю для узагальнення поза розподілом, навіть з 4-кратним зменшенням даних.