Про інженерію даних для масштабування термінальних можливостей великих мовних моделей
Автори: Renjie Pi, Grace Lam, Mohammad Shoeybi, Pooya Jannaty, Bryan Catanzaro, Wei Ping
Опубліковано: 2026-02-25
Переглянути на arXiv →Анотація
Ця стаття досліджує передові стратегії інженерії даних, які є вирішальними для масштабування великих мовних моделей (LLM) для розширення їх "термінальних можливостей", тобто їх здатності виконувати складні команди та взаємодіяти із зовнішніми інструментами. У ній викладено методології курування різноманітних, високоякісних наборів даних, що дозволяють LLM ефективно міркувати, планувати та діяти в реальних обчислювальних середовищах. Ця робота є критично важливою для практичного розгортання автономних агентів ШІ та інтелектуальних систем автоматизації.