Підхід, заснований на теорії рішень, для управління неузгодженістю

Автори: Daniel A. Herrmann, Abinav Chari, Isabelle Qian, Sree Sharvesh, B. A. Levinstein

Опубліковано: 2025-12-18

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття представляє підхід, заснований на теорії рішень, для управління невідповідністю в системах ШІ, що є критично важливим викликом для безпечного та етичного розгортання ШІ. Він пропонує формальну основу для обґрунтування та зменшення ризиків, пов'язаних із системами ШІ, цілі яких можуть не ідеально відповідати людським цінностям, пропонуючи практичні стратегії для відповідальної розробки та управління ШІ.

Підхід, заснований на теорії рішень, для управління неузгодженістю

Автори: Daniel A. Herrmann, Abinav Chari, Isabelle Qian, Sree Sharvesh, B. A. Levinstein

Опубліковано: 2025-12-18

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття представляє підхід, заснований на теорії рішень, для управління невідповідністю в системах ШІ, що є критично важливим викликом для безпечного та етичного розгортання ШІ. Він пропонує формальну основу для обґрунтування та зменшення ризиків, пов'язаних із системами ШІ, цілі яких можуть не ідеально відповідати людським цінностям, пропонуючи практичні стратегії для відповідальної розробки та управління ШІ.

FEEDBACK

Проекти

Немає проектів

Підхід, заснований на теорії рішень, для управління неузгодженістю | ArXiv Intelligence