Пакетне контекстуальне підкріплення: закон масштабування завдань для ефективного міркування
Автори: Bangji Yang, Hongbo Ma, Jiajun Fan, Ge Liu
Опубліковано: 2026-04-03
Переглянути на arXiv →#cs.AI
Анотація
Це дослідження представляє пакетне контекстуальне підкріплення, пропонуючи закон масштабування завдань для ефективного міркування в системах штучного інтелекту. Результати сприяють розробці більш масштабованих та ефективних підходів навчання з підкріпленням для вирішення складних проблем.