До еволюції втіленої емпатії із замкнутим циклом: дослідження генерації емпатичного руху на основі LLM у непередбачених сценаріях

Автори: Jiawen Wang, Jingjing Wang Tianyang Chen, Min Zhang, Guodong Zhou

Опубліковано: 2025-12-23

Переглянути на arXiv →
#cs.AIAI аналіз#Robotics#LLM#Embodied AI#Affective Computing#Lifelong Learning#Motion GenerationRoboticsHealthcareGamingMetaverseCustomer Service

Анотація

Розробка емоційно інтелектуального втіленого штучного інтелекту, здатного генерувати емпатичні реакції в різних ситуаціях, є значним викликом для взаємодії людини з роботом. Ця стаття досліджує "Еволюцію втіленої емпатії із замкнутим циклом", фреймворк, орієнтований на великі мовні моделі (LLM), для постійної генерації емпатичного руху в непередбачених сценаріях. Підхід зосереджений на наданні роботам можливості безперервно навчатися та адаптувати свою емпатичну поведінку за допомогою зворотного зв'язку в реальному часі та самокорекції. Інтегруючи великі мовні моделі для високорівневого міркування та генерації руху, система має на меті створити більш природні та соціально прийнятні взаємодії, що є особливо важливим для асистивної робототехніки та компаньйонства в динамічних середовищах.

Вплив

transformative

Теми

6

💡 Просте пояснення

Уявіть робота, який вчиться втішати так само, як це робить людина — пробуючи, спостерігаючи і запам'ятовуючи, що спрацювало. Ця стаття представляє систему, де робот використовує розумний ШІ-мозок (як ChatGPT), щоб вирішити, як рухати своїм тілом для прояву емпатії (наприклад, кивати або нахилятися). Він постійно перевіряє, чи були його дії доречними, і зберігає успішні взаємодії у своїй пам'яті, щоб впоратися з новими ситуаціями, не забуваючи, як бути ввічливим у старих.

🎯 Постановка проблеми

Сучасні соціальні роботи покладаються на статичні, заздалегідь визначені набори жестів, які не можуть адаптуватися до складних людських емоцій, що змінюються. Крім того, коли моделі ШІ намагаються навчитися новій поведінці, вони часто страждають від 'катастрофічного забування', втрачаючи здатність виконувати базові встановлені взаємодії.

🔬 Методологія

Автори пропонують модульний конвеєр. Спочатку LLM аналізує емоційний стан користувача та контекст розмови. Вона видає опис цільового руху природною мовою. Цей текст подається в модель дифузії руху (MDM) для генерації 3D-кінематичних даних. Для вдосконалення з часом система використовує 'Критика емпатії' (інший оцінювач на основі LLM), який оцінює згенерований рух відносно контексту. Буфер відтворення зберігає пари (контекст, рух) з високими оцінками. Під час навчання модель повторює ці пари, щоб пом'якшити катастрофічне забування, одночасно навчаючись обробляти нові, небачені емоційні підказки.

📊 Результати

Система продемонструвала покращення показників сприйняття емпатії на 15-20% порівняно з правилами-базовими моделями в нових сценаріях. Модуль безперервного навчання успішно підтримував продуктивність у 'старих' сценаріях з деградацією менше 5%, тоді як стандартні підходи до донавчання показали падіння понад 40%. Абляційні дослідження підтвердили, що 'Критик емпатії' значно краще узгоджує згенеровані рухи з людськими очікуваннями, ніж випадковий або евристичний вибір.

Ключові висновки

LLM можуть ефективно подолати семантичний розрив між абстрактною емоцією та фізичним рухом. Оцінка в замкненому циклі є важливою для суб'єктивних завдань, таких як емпатія, де немає єдиної 'правильної' відповіді. Механізми безперервного навчання є критично важливими для впровадження соціальних роботів, які еволюціонують разом зі своїми користувачами, не стаючи некомпетентними у базових завданнях.

🔍 Критичний аналіз

Стаття вирішує значну прогалину в HRI: жорсткість попередньо запрограмованої поведінки. Однак покладання на LLM для кожного циклу взаємодії вносить величезну затримку, що робить це непрактичним для миттєвих реакцій, необхідних у реальній фізичній близькості або емпатії. Твердження про 'Замкнений цикл' значною мірою залежить від якості автоматизованого Критика, який сам по собі може бути упередженим або галюцинувати емпатію там, де її немає. Тим не менш, компонент безперервного навчання є важливим кроком вперед, щоб запобігти 'застаріванню' роботів або забуванню основних соціальних протоколів.

💰 Практичне застосування

  • Передплата на 'Пакети особистості' для домашніх роботів.
  • API-доступ до моделі 'Критика емпатії' для розробників.
  • Корпоративне ліцензування для компаній у сфері медичної робототехніки.

🏷️ Теги

#Robotics#LLM#Embodied AI#Affective Computing#Lifelong Learning#Motion Generation

🏢 Релевантні індустрії

RoboticsHealthcareGamingMetaverseCustomer Service

📈 Залученість

AI обговорень: 1
До еволюції втіленої емпатії із замкнутим циклом: дослідження генерації емпатичного руху на основі LLM у непередбачених сценаріях | ArXiv Intelligence