Надійна та ефективна багатоагентна система навчання з підкріпленням для керування світлофорами
Автори: Sheng-You Huang, Hsiao-Chuan Chang, Yen-Chi Chen, Ting-Han Wei, I-Hau Yeh, Sheng-Yao Kuan, Chien-Yao Wang, Hsuan-Han Lee, I-Chen Wu
Опубліковано: 2026-03-13
Переглянути на arXiv →Анотація
Ця стаття пропонує надійну багатоагентну систему навчання з підкріпленням (MARL) для керування світлофорами, перевірену в симуляторі дорожнього руху Vissim. Вона вирішує проблеми узагальнення за допомогою адаптивного представлення стану, нової функції винагороди та протоколу зв'язку між агентами. Система демонструє чудову продуктивність у різних сценаріях дорожнього руху.