AdaFuse: Адаптивне ансамблеве декодування з масштабуванням під час тестування для великих мовних моделей
Автори: Chengming Cui, Tianxin Wei, Ziyi Chen, Ruizhong Qiu, Zhichen Zeng, Zhining Liu, Xuying Ning, Duo Zhou, Jingrui He
Опубліковано: 2026-01-12
Переглянути на arXiv →Анотація
Ця стаття пропонує AdaFuse, адаптивний метод ансамблевого декодування з масштабуванням під час тестування для великих мовних моделей (LLM). Цей підхід спрямований на підвищення продуктивності LLM шляхом динамічного об'єднання виходів з кількох моделей під час інференції, оптимізуючи точність та ефективність у різних програмах.