Розподіл робочого навантаження під час структурованої маршрутизації LLM в агентних експертних системах: повнофакторна крос-бекэнд методологія

Автори: Zhou Hanlin, Chan Huah Yong

Опубліковано: 2026-04-03

Переглянути на arXiv →
#cs.AI

Анотація

Структурована маршрутизація великих мовних моделей (LLM) часто розглядається як проблема проектування підказок. Ця стаття стверджує, що це, по суті, системна проблема розподілу навантаження, що балансує коректність, затримку та витрати на реалізацію в умовах реального розгортання, оскільки LLM стають основними компонентами управління в агентних системах штучного інтелекту.

Розподіл робочого навантаження під час структурованої маршрутизації LLM в агентних експертних системах: повнофакторна крос-бекэнд методологія

Автори: Zhou Hanlin, Chan Huah Yong

Опубліковано: 2026-04-03

Переглянути на arXiv →
#cs.AI

Анотація

Структурована маршрутизація великих мовних моделей (LLM) часто розглядається як проблема проектування підказок. Ця стаття стверджує, що це, по суті, системна проблема розподілу навантаження, що балансує коректність, затримку та витрати на реалізацію в умовах реального розгортання, оскільки LLM стають основними компонентами управління в агентних системах штучного інтелекту.

FEEDBACK

Проекти

Немає проектів

Розподіл робочого навантаження під час структурованої маршрутизації LLM в агентних експертних системах: повнофакторна крос-бекэнд методологія | ArXiv Intelligence