Підхід, заснований на теорії рішень, для управління неузгодженістю
Автори: Daniel A. Herrmann, Abinav Chari, Isabelle Qian, Sree Sharvesh, B. A. Levinstein
Опубліковано: 2025-12-18
Переглянути на arXiv →Анотація
Ця стаття представляє підхід, заснований на теорії рішень, для управління невідповідністю в системах ШІ, що є критично важливим викликом для безпечного та етичного розгортання ШІ. Він пропонує формальну основу для обґрунтування та зменшення ризиків, пов'язаних із системами ШІ, цілі яких можуть не ідеально відповідати людським цінностям, пропонуючи практичні стратегії для відповідальної розробки та управління ШІ.