FlexLLM: Компонувальна HLS бібліотека для гнучкого гібридного дизайну прискорювачів LLM
Автори: Jiahao Zhang, Zifan He, Nicholas Fraser, Michaela Blott, Yizhou Sun, Jason Cong
Опубліковано: 2026-01-23
Переглянути на arXiv →Анотація
Ця стаття представляє FlexLLM, компонувальну бібліотеку High-Level Synthesis (HLS), розроблену для гнучкого гібридного дизайну прискорювачів великих мовних моделей (LLM). Вона спрямована на оптимізацію розробки ефективного та адаптованого обладнання для виведення LLM, задовольняючи зростаючі обчислювальні вимоги найсучасніших моделей ШІ для розгортання в реальних умовах.