Дослідження великих мовних моделей, що діють як судді, у неперевірюваному постнавчанні LLM

Автори: Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen

Опубліковано: 2026-03-13

Переглянути на arXiv →
#cs.AI

Анотація

Це дослідження вивчає використання великих мовних моделей (LLM) з функцією міркування як суддів для оцінки інших LLM під час постнавчання в неперевірюваних сферах, досліджуючи їх ефективність, практичний вплив та потенційні підводні камені у складних, суб'єктивних завданнях.

Дослідження великих мовних моделей, що діють як судді, у неперевірюваному постнавчанні LLM

Автори: Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen

Опубліковано: 2026-03-13

Переглянути на arXiv →
#cs.AI

Анотація

Це дослідження вивчає використання великих мовних моделей (LLM) з функцією міркування як суддів для оцінки інших LLM під час постнавчання в неперевірюваних сферах, досліджуючи їх ефективність, практичний вплив та потенційні підводні камені у складних, суб'єктивних завданнях.

FEEDBACK

Проекти

Немає проектів