Рубрики для оцінки клінічного ШІ, специфічні для конкретних випадків: Методологія, валідація та згода LLM-клініцистів у 823 випадках
Автори: Aaryan Shah, Andrew Hines, Alexia Downs, Denis Bajet, Paulius Mui, Fabiano Araujo, Laura Offutt, Aida Rutledge, Elizabeth Jimenez
Опубліковано: 2026-04-28
Переглянути на arXiv →Анотація
Це дослідження пропонує методологію розробки та валідації специфічних для випадку рубрик для оцінки клінічних систем ШІ, зокрема зосереджуючись на згоді між великими мовними моделями (LLM) та клініцистами на великому наборі даних зустрічей з пацієнтами. Ця робота є критично важливою для безпечного та ефективного впровадження ШІ в охороні здоров'я, забезпечуючи надійну продуктивність у реальних клінічних умовах.