Від візуального сприйняття до глибокої емпатії: Автоматизована система оцінки малюнків "Будинок-Дерево-Людина" з використанням мультимодальних великих мовних моделей та багатоагентної співпраці.
Автори: Yutong Zhang, Qingyu Zhang, Yaxin Wang, Yujie Li, Xiangmin Xu
Опубліковано: 2025-12-23
Переглянути на arXiv →Анотація
Тест малюнка "Будинок-Дерево-Людина" (HTP), запроваджений Джоном Баком у 1948 році, залишається широко використовуваною проективною технікою в клінічній психології. Однак він давно стикається з такими проблемами, як неоднорідні стандарти оцінки, залежність від суб'єктивного досвіду експертів та відсутність єдиної кількісної системи кодування. Ця робота представляє автоматизовану систему оцінки малюнків HTP за допомогою мультимодальних великих мовних моделей (MLLM) та багатоагентної співпраці. Кількісні експерименти показали, що середня семантична схожість між інтерпретаціями MLLM та інтерпретаціями людських експертів становила приблизно 0,75. Якісні аналізи продемонстрували, що багатоагентна система, інтегруючи соціально-психологічні перспективи та дестигматизуючі наративи, ефективно виправляла візуальні галюцинації та створювала психологічні звіти з високою екологічною валідністю та внутрішньою узгодженістю. Результати підтверджують потенціал мультимодальних великих моделей як стандартизованих інструментів для проективної оцінки. Запропонована багатоагентна система, розділяючи ролі, відокремлює розпізнавання ознак від психологічного висновку та пропонує нову парадигму для цифрових послуг з психічного здоров'я.