Розподілена безпека ШІ (AGI)

Автори: Nenad Tomašev, Matija Franklin, Julian Jacobs, Sébastien Krier, Simon Osindero

Опубліковано: 2025-12-19

#cs.AI

Анотація

Ми представляємо концепцію Розподіленої безпеки ШІ (AGI), рамки для аналізу та забезпечення безпеки систем Загального Штучного Інтелекту (AGI) у різних операційних контекстах та потенційних режимах відмов. Цей підхід виходить за рамки одноточкових оцінок безпеки, розглядаючи повний розподіл можливих поведінок AGI та їх соціальний вплив. Ми пропонуємо методи надійного узгодження безпеки та зменшення ризиків, підкреслюючи необхідність адаптивних та контекстно-орієнтованих заходів безпеки для вирішення багатогранних проблем розгортання AGI.

Проекти

Немає проектів