Дворівнева стратегія підвищення відмовостійкості операційних систем реального часу з використанням ймовірнісного аналізу

Вантажиться...
Ескіз
Дата
2025
Назва журналу
Номер ISSN
Назва тому
Видавець
Хмельницький національний університет
Анотація
У роботі запропоновано дворівневу модель забезпечення відмовостійкості операційних систем реального часу, що поєднує апаратний сторожовий таймер із програмним модулем, який реалізує ймовірнісний моніторинг та проактивне відновлення компонентів. На відміну від класичних підходів, що здебільшого реагують лише після виникнення критичних збоїв, розроблений механізм орієнтований на раннє виявлення ознак деградації роботи системи. Оцінювання ризику збоїв виконується на основі ймовірнісних розрахунків, які враховують час реакції завдань, ступінь заповнення черг повідомлень, стабільність сигналів живості та інші показники. У разі виявлення потенційно небезпечних відхилень система ініціює локальний перезапуск окремих завдань або драйверів ще до того, як стан наблизиться до критичного. Це дозволяє своєчасно стабілізувати роботу, запобігати накопиченню помилок, зменшувати навантаження на мікроконтролер і суттєво скорочувати кількість повних перезавантажень. Інтеграція розробленої моделі з популярними операційними системами реального часу, зокрема FreeRTOS, спрощує її впровадження у вже наявні вбудовані рішення та забезпечує високу сумісність із апаратними платформами різних виробників. Запропонована стратегія особливо ефективна для систем із обмеженими обчислювальними ресурсами, таких як автономні робототехнічні комплекси, промислові контролери, безпілотні літальні апарати та пристрої Інтернету речей. Експериментальні дослідження показали, що застосування дворівневої моделі дозволяє зменшити середній час простою системи, знизити кількість глобальних перезапусків у кілька разів та підвищити загальну надійність роботи без значного збільшення використання процесорного часу й пам’яті. Отримані результати підтверджують доцільність використання підходу як гнучкого та ефективного засобу підвищення відмовостійкості сучасних кіберфізичних систем.
The paper proposes a two-level fault-tolerance model for real-time operating systems that combines a hardware watchdog timer with a software module implementing probabilistic monitoring and proactive component recovery. Unlike classical approaches, which mostly react only after critical failures occur, the developed mechanism focuses on early detection of system performance degradation. Failure risk assessment is performed based on probabilistic calculations that take into account task response times, message queue occupancy, stability of heartbeat signals signals, and other indicators. When potentially dangerous deviations are detected, the system initiates a local restart of individual tasks or drivers before the state approaches a critical level. This enables timely stabilization of operation, prevents error accumulation, reduces the load on the microcontroller, and significantly decreases the number of full system reboots. Integration of the developed model with popular real-time operating systems, such as FreeRTOS, simplifies its implementation in existing embedded solutions and ensures high compatibility with hardware platforms from various manufacturers. The proposed strategy is particularly effective for systems with limited computing resources, such as autonomous robotic complexes, industrial controllers, unmanned aerial vehicles, and Internet of Things devices. Experimental studies have shown that applying the two-level model can reduce the system’s average downtime, decrease the number of global restarts severalfold, and improve overall operational reliability without significantly increasing CPU and memory usage. The obtained results confirm the feasibility of using the proposed approach as a flexible and efficient means of enhancing the fault tolerance of modern cyber-physical systems.
Опис
Ключові слова
операційні системи, ймовірнісний аналіз, сторожовий таймер, відмовостійкість, програмне скидання, кіберфізичні системи, надійність, системи реального часу, operating systems, probabilistic analysis, watchdog timer, fault tolerance, soft reset, cyber-physical systems, reliability, real-time systems
Бібліографічний опис
Козельський О. Дворівнева стратегія підвищення відмовостійкості операційних систем реального часу з використанням ймовірнісного аналізу / О. Козельський, Б. Савенко, О. Савенко // Herald of Khmelnytskyi National University. Technical Sciences. – 2025. – Vol. 353, No. 3.2. – P. 438-446.