Розпізнавання емоцій мовлення за допомогою представлень Whisper від OpenAI та методів уважного агрегування
Автори: Ali Shendabadi, Parnia Izadirad, Mostafa Salehi, Mahmoud Bijankhan
Опубліковано: 2026-02-06
Переглянути на arXiv →Анотація
Ця стаття зосереджена на покращенні розпізнавання емоцій мовлення шляхом використання представлень з моделі Whisper від OpenAI у поєднанні з методами уважного агрегування. Це досягнення має значні практичні застосування в таких галузях, як взаємодія людини з комп'ютером, обслуговування клієнтів та моніторинг психічного здоров'я.