CORL: Навчання зі зміцненням політик MILP, розв'язуваних методом гілок і меж

Автори: Akhil S Anand, Elias Aarekol, Martin Mziray Dalseg, Magnus Stalhane, Sebastien Gros

Опубліковано: 2025-12-15

#cs.AI

Анотація

Ця стаття представляє CORL, метод навчання зі зміцненням політик для розв'язання задач змішано-цілочисельного лінійного програмування (MILP) за допомогою алгоритмів гілок і меж. Він вирішує проблеми субоптимальної продуктивності у стохастичних задачах реального світу шляхом покращення моделювання MILP, з значним потенціалом для застосувань в оптимізації та прийнятті рішень.

CORL: Навчання зі зміцненням політик MILP, розв'язуваних методом гілок і меж

Автори: Akhil S Anand, Elias Aarekol, Martin Mziray Dalseg, Magnus Stalhane, Sebastien Gros

Опубліковано: 2025-12-15

Переглянути на arXiv →

#cs.AI

Анотація

FEEDBACK

Проекти

Немає проектів