LLM-ForcedAligner: Неавторегресивний і точний примусовий вирівнювач на основі LLM для багатомовної та довгоформатної мови
Автори: Bingshen Mu, Xian Shi, Xiong Wang, Hexin Liu, Jin Xu, Lei Xie
Опубліковано: 2026-01-26
Переглянути на arXiv →Анотація
Традиційні методи примусового вирівнювання (FA) часто страждають від мовної специфічності та кумулятивних часових зсувів. Ця стаття представляє LLM-ForcedAligner, новий підхід, який переформульовує FA як парадигму заповнення слотів за допомогою великих мовних моделей (LLM) для багатомовної, міжмовної та довгоформатної мови. Розглядаючи позначки часу як дискретні індекси та вставляючи спеціальні токени позначок часу як слоти, модель безпосередньо прогнозує часові індекси в цих слотах. Цей дизайн підтримує неавторегресивний висновок, ефективно уникаючи галюцинацій та значно підвищуючи швидкість, досягаючи суттєвого зменшення накопиченого середнього зсуву порівняно з попередніми методами FA.