Безпечне управління міським трафіком за допомогою конформного прогнозування з урахуванням невизначеності та навчання з підкріпленням за допомогою моделі світу
Автори: Joydeep Chandra, Satyam Kumar Navneet, Aleksandr Algazinov, Yong Zhang
Опубліковано: 2026-02-04
Переглянути на arXiv →Анотація
Управління міським трафіком вимагає систем, які одночасно прогнозують майбутні умови, виявляють аномалії та вживають безпечних коригувальних заходів, надаючи при цьому гарантії надійності. Ми представляємо STREAM-RL, уніфіковану структуру з трьома новими алгоритмічними внесками: PU-GAT+, адаптивний конформний прогнозист, керований невизначеністю; CRFN-BY, конформна залишкова мережа потоків; та LyCon-WRL+, агент RL моделі світу, керований невизначеністю, із сертифікатами стабільності Ляпунова. Це перша структура, яка поширює калібровану невизначеність від прогнозування через виявлення аномалій до безпечного навчання політики з наскрізними теоретичними гарантіями. Експерименти з реальними даними траєкторій трафіку демонструють високу ефективність покриття, контрольовану частоту хибних виявлень та покращену швидкість безпеки порівняно зі стандартним PPO.