Не Пошук, А Сканування: Бенчмаркінг MLLM на Обґрунтуванні Наукових Робіт, Орієнтованому на Сканування

Автори: Rongjin Li, Zichen Tang, Xianghe Wang, Xinyi Hu, Zhengyu Wang, Zhengyu Lu, Yiling Huang, Jiayuan Chen, Weisheng Tan, Jiacheng Liu, Zhongjun Yang, Haihong E

Опубліковано: 2026-03-31

Переглянути на arXiv →
#cs.AI

Анотація

Це дослідження представляє новий бенчмарк для оцінки мультимодальних великих мовних моделей (MLLM) спеціально щодо їхньої здатності виконувати 'орієнтоване на сканування' обґрунтування наукових робіт, виходячи за рамки простих пошукових запитів для оцінки глибших можливостей розуміння та вилучення інформації. Він заповнює критичну прогалину в поточній оцінці MLLM.

Не Пошук, А Сканування: Бенчмаркінг MLLM на Обґрунтуванні Наукових Робіт, Орієнтованому на Сканування

Автори: Rongjin Li, Zichen Tang, Xianghe Wang, Xinyi Hu, Zhengyu Wang, Zhengyu Lu, Yiling Huang, Jiayuan Chen, Weisheng Tan, Jiacheng Liu, Zhongjun Yang, Haihong E

Опубліковано: 2026-03-31

Переглянути на arXiv →
#cs.AI

Анотація

Це дослідження представляє новий бенчмарк для оцінки мультимодальних великих мовних моделей (MLLM) спеціально щодо їхньої здатності виконувати 'орієнтоване на сканування' обґрунтування наукових робіт, виходячи за рамки простих пошукових запитів для оцінки глибших можливостей розуміння та вилучення інформації. Він заповнює критичну прогалину в поточній оцінці MLLM.

FEEDBACK

Проекти

Немає проектів

Не Пошук, А Сканування: Бенчмаркінг MLLM на Обґрунтуванні Наукових Робіт, Орієнтованому на Сканування | ArXiv Intelligence