Пакетне контекстуальне підкріплення: Закон масштабування завдань для ефективного міркування

Автори: Bangji Yang, Hongbo Ma, Jiajun Fan, Ge Liu

Опубліковано: 2026-04-03

#cs.AI

Анотація

Це дослідження представляє пакетне контекстуальне підкріплення, пропонуючи закон масштабування завдань для ефективного міркування в системах ШІ. Оптимізуючи, як моделі ШІ навчаються та узагальнюють з партій контекстуальних даних, ця робота має на меті покращити ефективність та масштабованість навчання з підкріпленням, що є вирішальним для розробки більш потужних та ресурсоефективних агентів ШІ в різних застосуваннях від робототехніки до складних систем прийняття рішень.

Пакетне контекстуальне підкріплення: Закон масштабування завдань для ефективного міркування

Автори: Bangji Yang, Hongbo Ma, Jiajun Fan, Ge Liu

Опубліковано: 2026-04-03

Переглянути на arXiv →

#cs.AI

Анотація

FEEDBACK

Проекти

Немає проектів

Пакетне контекстуальне підкріплення: Закон масштабування завдань для ефективного міркування | ArXiv Intelligence