SkillTester: Оцінка корисності та безпеки навичок агентів

Автори: Leye Wang, Zixing Wang, Anjie Xu

Опубліковано: 2026-03-28

Переглянути на arXiv →
#cs.AI

Анотація

Цей технічний звіт представляє SkillTester, інструмент для оцінки корисності та безпеки навичок агента. Його фреймворк поєднує парні базові та з використанням навичок умови виконання з пакетом тестів безпеки. Базуючись на принципах порівняльної корисності та простоти для користувача, він нормалізує вихідні артефакти виконання до оцінок корисності та безпеки та трирівневої мітки статусу безпеки. Він прагне стати порівняльним засобом забезпечення якості для навичок агента у світі, орієнтованому на агентів.

SkillTester: Оцінка корисності та безпеки навичок агентів

Автори: Leye Wang, Zixing Wang, Anjie Xu

Опубліковано: 2026-03-28

Переглянути на arXiv →
#cs.AI

Анотація

Цей технічний звіт представляє SkillTester, інструмент для оцінки корисності та безпеки навичок агента. Його фреймворк поєднує парні базові та з використанням навичок умови виконання з пакетом тестів безпеки. Базуючись на принципах порівняльної корисності та простоти для користувача, він нормалізує вихідні артефакти виконання до оцінок корисності та безпеки та трирівневої мітки статусу безпеки. Він прагне стати порівняльним засобом забезпечення якості для навичок агента у світі, орієнтованому на агентів.

FEEDBACK

Проекти

Немає проектів