ClawEnvKit: Автоматична генерація середовищ для агентів типу "кіготь"

Автори: Xirui Li, Ming Li, Derry Xu, Wei-Lin Chiang, Ion Stoica, Cho-Jui Hsieh, Tianyi Zhou

Опубліковано: 2026-04-21

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття представляє ClawEnvKit, автономний конвеєр для генерації різноманітних та перевірених середовищ для навчання та оцінки роботів-агентів типу "кіготь" на основі описів природною мовою. Цей інструментарій спрощує створення великомасштабних бенчмарків, вирішуючи проблеми масштабованості ручного конструювання середовищ. Він включає парсер, генератор та валідатор для забезпечення доцільності, різноманітності та узгодженості згенерованих середовищ. Отриманий бенчмарк Auto-ClawEval демонструє значне зниження витрат та покращення масштабу оцінки, показуючи, що інженерія упряжі підвищує продуктивність та підкреслює потребу в безперервній оцінці.

ClawEnvKit: Автоматична генерація середовищ для агентів типу "кіготь"

Автори: Xirui Li, Ming Li, Derry Xu, Wei-Lin Chiang, Ion Stoica, Cho-Jui Hsieh, Tianyi Zhou

Опубліковано: 2026-04-21

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття представляє ClawEnvKit, автономний конвеєр для генерації різноманітних та перевірених середовищ для навчання та оцінки роботів-агентів типу "кіготь" на основі описів природною мовою. Цей інструментарій спрощує створення великомасштабних бенчмарків, вирішуючи проблеми масштабованості ручного конструювання середовищ. Він включає парсер, генератор та валідатор для забезпечення доцільності, різноманітності та узгодженості згенерованих середовищ. Отриманий бенчмарк Auto-ClawEval демонструє значне зниження витрат та покращення масштабу оцінки, показуючи, що інженерія упряжі підвищує продуктивність та підкреслює потребу в безперервній оцінці.

FEEDBACK

Проекти

Немає проектів