HippoCamp: Бенчмаркінг контекстуальних агентів на персональних комп'ютерах
Автори: Zhe Yang, Shulin Tian, Kairui Hu, Shuai Liu, Hoang-Nhat Nguyen, Yichi Zhang, Zujin Guo, Mengying Yu, Zinan Zhang, Jingkang Yang, Chen Change Loy, Ziwei Liu
Опубліковано: 2026-04-02
Переглянути на arXiv →Анотація
"HippoCamp" представляє бенчмарк для оцінки контекстуальних агентів ШІ, розроблених для роботи на персональних комп'ютерах. Це має вирішальне значення для розвитку систем ШІ, які можуть розуміти та допомагати користувачам у їхніх настільних середовищах, забезпечуючи більш інтуїтивні персональні асистенти, автоматизовані робочі процеси та контекстно-залежні програми.