AdaFuse: Адаптивне ансамблеве декодування з масштабуванням під час тестування для великих мовних моделей

Автори: Chengming Cui, Tianxin Wei, Ziyi Chen, Ruizhong Qiu, Zhichen Zeng, Zhining Liu, Xuying Ning, Duo Zhou, Jingrui He

Опубліковано: 2026-01-12

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття пропонує AdaFuse, адаптивний метод ансамблевого декодування з масштабуванням під час тестування для великих мовних моделей (LLM). Цей підхід спрямований на підвищення продуктивності LLM шляхом динамічного об'єднання виходів з кількох моделей під час інференції, оптимізуючи точність та ефективність у різних програмах.

AdaFuse: Адаптивне ансамблеве декодування з масштабуванням під час тестування для великих мовних моделей

Автори: Chengming Cui, Tianxin Wei, Ziyi Chen, Ruizhong Qiu, Zhichen Zeng, Zhining Liu, Xuying Ning, Duo Zhou, Jingrui He

Опубліковано: 2026-01-12

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття пропонує AdaFuse, адаптивний метод ансамблевого декодування з масштабуванням під час тестування для великих мовних моделей (LLM). Цей підхід спрямований на підвищення продуктивності LLM шляхом динамічного об'єднання виходів з кількох моделей під час інференції, оптимізуючи точність та ефективність у різних програмах.

FEEDBACK

Проекти

Немає проектів

AdaFuse: Адаптивне ансамблеве декодування з масштабуванням під час тестування для великих мовних моделей | ArXiv Intelligence