ScoringBench: Бенчмарк для оцінки табличних фундаментальних моделей з правильними оціночними правилами
Автори: Jonas Landsgesell, Pascal Knoll
Опубліковано: 2026-04-01
Переглянути на arXiv →Анотація
ScoringBench представлено як бенчмарк для оцінки табличних фундаментальних моделей з використанням правильних оціночних правил. Це має вирішальне значення для оцінки надійності та калібрування прогнозів цих моделей, які широко використовуються в різних реальних додатках, таких як фінанси, охорона здоров'я та рекомендаційні системи.