Квантово-навіяне багатоагентне навчання з підкріпленням для оптимізації дослідження-експлуатації при розгортанні мереж 6G за допомогою БПЛА
Автори: Mazyar Taghavi, Javad Vahidi
Опубліковано: 2025-12-25
Переглянути на arXiv →Анотація
Це дослідження представляє квантово-навіяний фреймворк для оптимізації компромісу між дослідженням та експлуатацією в багатоагентному навчанні з підкріпленням (MARL), зокрема застосований до розгортання мереж 6G за допомогою БПЛА. Фреймворк передбачає спільну координацію десяти інтелектуальних БПЛА для максимізації покриття сигналу та підтримки ефективного розширення мережі в умовах часткової спостережуваності та динамічних умов. Він інтегрує класичні алгоритми MARL з квантово-навіяними методами оптимізації, використовуючи варіаційні квантові схеми (VQC) та квантовий алгоритм наближеної оптимізації (QAOA). Підхід також включає імовірнісне моделювання (байєсівський висновок, гаусові процеси) для захоплення прихованої динаміки навколишнього середовища. Експериментальні результати демонструють кращу продуктивність з точки зору ефективності дослідження, швидкості покриття та швидкості збіжності порівняно з класичними методами MARL, пропонуючи надійне рішення для оптимізації комунікаційних мереж наступного покоління.