Розподіл робочого навантаження під час структурованої маршрутизації LLM в агентних експертних системах: повнофакторна крос-бекэнд методологія
Автори: Zhou Hanlin, Chan Huah Yong
Опубліковано: 2026-04-03
Переглянути на arXiv →Анотація
Структурована маршрутизація великих мовних моделей (LLM) часто розглядається як проблема проектування підказок. Ця стаття стверджує, що це, по суті, системна проблема розподілу навантаження, що балансує коректність, затримку та витрати на реалізацію в умовах реального розгортання, оскільки LLM стають основними компонентами управління в агентних системах штучного інтелекту.