ScoringBench: Бенчмарк для оцінки табличних фундаментальних моделей з правильними оціночними правилами

Автори: Jonas Landsgesell, Pascal Knoll

Опубліковано: 2026-04-01

Переглянути на arXiv →
#cs.AI

Анотація

ScoringBench представлено як бенчмарк для оцінки табличних фундаментальних моделей з використанням правильних оціночних правил. Це має вирішальне значення для оцінки надійності та калібрування прогнозів цих моделей, які широко використовуються в різних реальних додатках, таких як фінанси, охорона здоров'я та рекомендаційні системи.

ScoringBench: Бенчмарк для оцінки табличних фундаментальних моделей з правильними оціночними правилами

Автори: Jonas Landsgesell, Pascal Knoll

Опубліковано: 2026-04-01

Переглянути на arXiv →
#cs.AI

Анотація

ScoringBench представлено як бенчмарк для оцінки табличних фундаментальних моделей з використанням правильних оціночних правил. Це має вирішальне значення для оцінки надійності та калібрування прогнозів цих моделей, які широко використовуються в різних реальних додатках, таких як фінанси, охорона здоров'я та рекомендаційні системи.

FEEDBACK

Проекти

Немає проектів