Reinforcement learning method for autonomous flight path planning of multiple UAVs

Velychko, Maksym; Kysil, Tetiana

Reinforcement learning method for autonomous flight path planning of multiple UAVs

dc.contributor.author	Velychko, Maksym
dc.contributor.author	Kysil, Tetiana
dc.date.accessioned	2025-09-01T14:17:00Z
dc.date.available	2025-09-01T14:17:00Z
dc.date.issued	2025
dc.description.abstract	This study aims to develop a reinforcement learning method for autonomous flight path planning of multiple UAVs under real-world conditions with limited observations and multiple conflicting optimization objectives. The research proposes a multi-agent reinforcement learning approach based on Proximal Policy Optimization (PPO) combined with centralized training and decentralized execution (CTDE). Additionally, a recurrent neural network (RNN) layer is integrated into the critic and actor networks to address partial observability. The reward function is designed to balance time efficiency, safety, and area coverage. Experimental results demonstrate that the proposed method significantly outperforms independent learning approaches in terms of reward accumulation, convergence speed, and decision stability. The CTDE architecture with RNN-enhanced critics proved effective in handling the challenges of multi-agent coordination and partial observability. The trained model enables real-time trajectory planning in three-dimensional environments, surpassing traditional optimization methods. The novelty lies in the application of a multi-agent PPO architecture enhanced by RNNs under CTDE for solving real-time multi-objective optimization problems in UAV path planning. A customized reward structure was developed to simultaneously optimize safety, time, and coverage objectives without retraining. The developed method enables efficient and reliable online trajectory planning for UAV groups, making it applicable in surveillance, search and rescue, and exploration missions where rapid and adaptive decision-making is essential.
dc.identifier.citation	Velychko M. Reinforcement learning method for autonomous flight path planning of multiple UAVs / M Velychko., T. Kysil // Computer Systems and Information Technologies. – 2025. – № 2. – P. 172-180.
dc.identifier.uri	https://elar.khmnu.edu.ua/handle/123456789/19354
dc.language.iso	en
dc.publisher	Хмельницький національний університет
dc.subject	multiple UAVs
dc.subject	path planning
dc.subject	reinforcement learning
dc.subject	centralized training
dc.subject	decentralized execution
dc.subject	multi-agent systems
dc.subject	PPO algorithm
dc.subject	RNN
dc.subject	CTDE architecture
dc.subject.udc	629.735.33:004.896
dc.title	Reinforcement learning method for autonomous flight path planning of multiple UAVs
dc.type	Стаття

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: CSIT-2025-N2+(19)+172-180 (1).pdf
Розмір:: 996.32 KB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 4.26 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

CSIT - 2025 рік