CORL: Навчання зі зміцненням політик MILP, розв'язуваних методом гілок і меж
Автори: Akhil S Anand, Elias Aarekol, Martin Mziray Dalseg, Magnus Stalhane, Sebastien Gros
Опубліковано: 2025-12-15
Переглянути на arXiv →Анотація
Ця стаття представляє CORL, метод навчання зі зміцненням політик для розв'язання задач змішано-цілочисельного лінійного програмування (MILP) за допомогою алгоритмів гілок і меж. Він вирішує проблеми субоптимальної продуктивності у стохастичних задачах реального світу шляхом покращення моделювання MILP, з значним потенціалом для застосувань в оптимізації та прийнятті рішень.