LSRIF: Логічно-структуроване навчання з підкріпленням для виконання інструкцій
Автори: Qingyu Ren, Qianyu He, Jingwen Chang, Jie Zeng, Jiaqing Liang, Yanghua Xiao, Han Xia, Zeye Sun, Fei Yu
Опубліковано: 2026-01-10
Переглянути на arXiv →Анотація
LSRIF представляє логічно-структуровану навчальну платформу, яка явно моделює логіку інструкцій для великих мовних моделей, щоб покращити виконання інструкцій. Вона вирішує проблеми з послідовними залежностями та умовними розгалуженнями у реальних інструкціях, що є критично важливим для просунутих агентів ШІ та автоматизації.