Вирішення проблеми повторення в LLM на виробництві: Комплексне дослідження множинних рішень

Автори: Zhao Lihua, Gao Jian, Huang Mei

Опубліковано: 2025-12-02

#cs.AI

Анотація

Дослідники з Shenzhen Sunline Tech Co., Ltd. вирішили проблему повторення LLM при інтерпретації фінансового пакетного коду на виробництві, оцінивши кілька рішень. Їхнє дослідження показало, що Beam Search з `early_stopping=True` ефективно усуває повторення, досягаючи 0% частоти повторень, а Direct Preference Optimization (DPO) знижує частоту повторень з 13-60% до 0-2% у різних сценаріях, відновлюючи нормальну продуктивність обробки.

Вирішення проблеми повторення в LLM на виробництві: Комплексне дослідження множинних рішень

Автори: Zhao Lihua, Gao Jian, Huang Mei

Опубліковано: 2025-12-02

Переглянути на arXiv →

#cs.AI

Анотація

FEEDBACK

Проекти

Немає проектів