ReThinker: Наукове мислення шляхом переосмислення з керованою рефлексією та контролем впевненості
Автори: Zhentao Tang, Yuqi Cui, Shixiong Kai, Wenqian Zhao, Ke Ye, Xing Li, Anxin Tian, Zehua Pei, Hui-Ling Zhen, Shoubo Hu, Xiaoguang Li, Yunhe Wang, Mingxuan Yuan
Опубліковано: 2026-02-03
Переглянути на arXiv →Анотація
Наукове мислення на експертному рівні залишається складним завданням для великих мовних моделей, особливо на бенчмарках, таких як Humanity's Last Exam (HLE), де жорсткі конвеєри інструментів, крихка багатоагентна координація та неефективне масштабування під час тестування часто обмежують продуктивність. Ми представляємо ReThinker, агентну структуру, яка підвищує наукове мислення LLM через керовану рефлексію та адаптивний контроль впевненості. Це дозволяє моделям виявляти та виправляти помилки, що призводить до більш надійних та точних наукових досліджень.