Дослідження великих мовних моделей, що діють як судді, у неперевірюваному постнавчанні LLM
Автори: Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen
Опубліковано: 2026-03-13
Переглянути на arXiv →Анотація
Це дослідження вивчає використання великих мовних моделей (LLM) з функцією міркування як суддів для оцінки інших LLM під час постнавчання в неперевірюваних сферах, досліджуючи їх ефективність, практичний вплив та потенційні підводні камені у складних, суб'єктивних завданнях.