FlexLLM: Компонувальна HLS бібліотека для гнучкого гібридного дизайну прискорювачів LLM

Автори: Jiahao Zhang, Zifan He, Nicholas Fraser, Michaela Blott, Yizhou Sun, Jason Cong

Опубліковано: 2026-01-23

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття представляє FlexLLM, компонувальну бібліотеку High-Level Synthesis (HLS), розроблену для гнучкого гібридного дизайну прискорювачів великих мовних моделей (LLM). Вона спрямована на оптимізацію розробки ефективного та адаптованого обладнання для виведення LLM, задовольняючи зростаючі обчислювальні вимоги найсучасніших моделей ШІ для розгортання в реальних умовах.

FlexLLM: Компонувальна HLS бібліотека для гнучкого гібридного дизайну прискорювачів LLM

Автори: Jiahao Zhang, Zifan He, Nicholas Fraser, Michaela Blott, Yizhou Sun, Jason Cong

Опубліковано: 2026-01-23

Переглянути на arXiv →
#cs.AI

Анотація

Ця стаття представляє FlexLLM, компонувальну бібліотеку High-Level Synthesis (HLS), розроблену для гнучкого гібридного дизайну прискорювачів великих мовних моделей (LLM). Вона спрямована на оптимізацію розробки ефективного та адаптованого обладнання для виведення LLM, задовольняючи зростаючі обчислювальні вимоги найсучасніших моделей ШІ для розгортання в реальних умовах.

FEEDBACK

Проекти

Немає проектів

FlexLLM: Компонувальна HLS бібліотека для гнучкого гібридного дизайну прискорювачів LLM | ArXiv Intelligence