Вирішення проблеми повторення в LLM на виробництві: Комплексне дослідження множинних рішень
Автори: Zhao Lihua, Gao Jian, Huang Mei
Опубліковано: 2025-12-02
Переглянути на arXiv →Анотація
Дослідники з Shenzhen Sunline Tech Co., Ltd. вирішили проблему повторення LLM при інтерпретації фінансового пакетного коду на виробництві, оцінивши кілька рішень. Їхнє дослідження показало, що Beam Search з `early_stopping=True` ефективно усуває повторення, досягаючи 0% частоти повторень, а Direct Preference Optimization (DPO) знижує частоту повторень з 13-60% до 0-2% у різних сценаріях, відновлюючи нормальну продуктивність обробки.