AgentSearchBench: Еталон для пошуку агентів ШІ в реальних умовах.
Автори: Bin Wu, Arastun Mammadli, Xiaoyu Zhang, Emine Yilmaz
Опубліковано: 2026-04-27
Переглянути на arXiv →#cs.AI
Анотація
Ця стаття представляє AgentSearchBench, новий еталон, розроблений для оцінки продуктивності агентів ШІ в складних, реальних сценаріях пошуку, надаючи надійну основу для оцінки можливостей агентів у непередбачених умовах.