DIVE: Масштабування різноманітності в синтезі агентних завдань для узагальнюваного використання інструментів

Автори: Aili Chen, Chi Zhang, Junteng Liu, Jiangjie Chen, Chengyu Du, Yunji Li, Ming Zhong, Qin Wang, Zhengmao Zhu, Jiayuan Song, Ke Ji, Junxian He, Pengyu Zhao, Yanghua Xiao

Опубліковано: 2026-03-10

Переглянути на arXiv →

#cs.AI

Анотація

Недавні дослідження синтезують агентні завдання для LLM, що використовують інструменти після навчання, проте надійна узагальнюваність при зміні завдань та наборів інструментів залишається відкритою проблемою. Ця крихкість пов'язана з недостатньою різноманітністю синтезованих завдань. У статті пропонується DIVE, рецепт, керований доказами, який інвертує порядок синтезу, спочатку виконуючи різноманітні, реальні інструменти та зворотно виводячи завдання, що строго випливають з отриманих слідів. Цей метод значно покращує узагальнюваність використання інструментів і перевершує масштабування за кількістю для узагальнення поза розподілом, навіть з 4-кратним зменшенням даних.

Проекти

Немає проектів