Рубрики для оцінки клінічного ШІ, специфічні для конкретних випадків: Методологія, валідація та згода LLM-клініцистів у 823 випадках

Автори: Aaryan Shah, Andrew Hines, Alexia Downs, Denis Bajet, Paulius Mui, Fabiano Araujo, Laura Offutt, Aida Rutledge, Elizabeth Jimenez

Опубліковано: 2026-04-28

Переглянути на arXiv →
#cs.AI

Анотація

Це дослідження пропонує методологію розробки та валідації специфічних для випадку рубрик для оцінки клінічних систем ШІ, зокрема зосереджуючись на згоді між великими мовними моделями (LLM) та клініцистами на великому наборі даних зустрічей з пацієнтами. Ця робота є критично важливою для безпечного та ефективного впровадження ШІ в охороні здоров'я, забезпечуючи надійну продуктивність у реальних клінічних умовах.

Рубрики для оцінки клінічного ШІ, специфічні для конкретних випадків: Методологія, валідація та згода LLM-клініцистів у 823 випадках

Автори: Aaryan Shah, Andrew Hines, Alexia Downs, Denis Bajet, Paulius Mui, Fabiano Araujo, Laura Offutt, Aida Rutledge, Elizabeth Jimenez

Опубліковано: 2026-04-28

Переглянути на arXiv →
#cs.AI

Анотація

Це дослідження пропонує методологію розробки та валідації специфічних для випадку рубрик для оцінки клінічних систем ШІ, зокрема зосереджуючись на згоді між великими мовними моделями (LLM) та клініцистами на великому наборі даних зустрічей з пацієнтами. Ця робота є критично важливою для безпечного та ефективного впровадження ШІ в охороні здоров'я, забезпечуючи надійну продуктивність у реальних клінічних умовах.

FEEDBACK

Проекти

Немає проектів

Рубрики для оцінки клінічного ШІ, специфічні для конкретних випадків: Методологія, валідація та згода LLM-клініцистів у 823 випадках | ArXiv Intelligence