MathNet: Глобальний мультимодальний бенчмарк для математичного мислення та пошуку
Автори: Shaden Alshammari, Kevin Wen, Abrar Zainal, Mark Hamilton, Navid Safaei, Sultan Albarakati, William T. Freeman, Antonio Torralba
Опубліковано: 2026-04-21
Переглянути на arXiv →Анотація
MathNet представлений як глобальний мультимодальний бенчмарк для оцінки можливостей математичного мислення та пошуку систем ШІ. Цей бенчмарк має вирішальне значення для просування ШІ, яка може надійно розуміти та вирішувати складні математичні проблеми, з широкими наслідками для наукових відкриттів, інженерії та освіти.