Модель процесу виявлення витоків даних з еволюційною адаптацією

dc.contributor.authorВіжевський, Петро
dc.contributor.authorCавенко, Олег
dc.contributor.authorVizhevskyi, Petro
dc.contributor.authorSavenko, Oleg
dc.date.accessioned2026-03-23T14:20:21Z
dc.date.available2026-03-23T14:20:21Z
dc.date.issued2026
dc.description.abstractУ роботі запропоновано узагальнену модель процесу виявлення витоків даних з еволюційною адаптацією, побудовану на інтеграції трьох функціональних складових: класифікації документів за рівнем конфіденційності на основі генетичного алгоритму з IF-THEN правилами, виявлення дрейфу концепції через двовіконний статистичний детектор (критерій Колмогорова-Смірнова та t-тест) й адаптивного поведінкового профілювання користувачів із експоненціальним забуванням. Описано архітектуру DLP-системи. Показано механізм зворотного зв’язку, за яким детектор дрейфу підсилює мутацію в генетичному алгоритмі, а поведінковий модуль коригує порогові значення. Експериментальна оцінка на корпусі розсекречених урядових документів DISC (2 450 документів, три рівні конфіденційності) підтверджує: GA-класифікатор досягає F1 = 0,867, поступаючись ансамблевим методам лише на 5-6 %. при повній інтерпретованості правил, механізм адаптації підвищує prequential F1 на 7,6 %, а поведінковий детектор із генетичною оптимізацією ваг забезпечує FPR = 0,023. Модель зберігає повну інтерпретованість рішень, придатну для аудиту та верифікації експертами з безпеки.
dc.description.abstractThe paper presents a generalized model of the data leakage detection process with evolutionary adaptation, based on the integration of three functional components: document classification using a genetic algorithm with IF–THEN rules, concept drift detection through a dual-window statistical detector (Kolmogorov–Smirnov test and Student’s t-test), and adaptive user behavioral profiling with exponential forgetting. The architecture of the proposed DLP system is described as a modular structure combining content analysis, behavioral monitoring, and adaptive parameter control. A feedback mechanism is implemented to ensure dynamic adaptation. When the drift detector identifies statistically significant distributional changes in input features, it increases the mutation rate of the genetic algorithm, thereby accelerating the evolution of classification rules. Simultaneously, the behavioral profiling module adjusts decision thresholds according to updated user activity patterns. This coordinated interaction enables the system to adapt to evolving data characteristics and usage scenarios without requiring architectural modifications or retraining from scratch. Experimental evaluation was conducted on the DISC corpus of declassified government documents (2,450 documents across three security levels). Results demonstrate that the genetic algorithm–based classifier achieves an F1-score of 0.867, trailing ensemble methods by only 5–6% while preserving full interpretability of decision rules. The evolutionary adaptation mechanism increases prequential F1 by 7.6%, confirming its effectiveness under streaming conditions with potential distribution shifts. In addition, the behavioral anomaly detector with genetically optimized feature weights achieves a low false positive rate (FPR = 0.023), improving operational reliability. The proposed model maintains complete transparency of classification logic, making it suitable for audit, compliance verification, and expert validation in security-sensitive environments. Overall, the integration of evolutionary learning, statistical drift monitoring, and adaptive behavioral analysis forms a robust, interpretable, and practically deployable framework for data leakage prevention systems operating in dynamic organizational contexts
dc.identifier.citationВіжевський П., Cавенко О. Модель процесу виявлення витоків даних з еволюційною адаптацією // Вимірювальна та обчислювальна техніка в технологічних процесах. 2026. № 1. С. 270-277.
dc.identifier.doihttps://doi.org/10.31891/2219-9365-2026-85-34
dc.identifier.urihttps://elar.khmnu.edu.ua/handle/123456789/20905
dc.language.isouk
dc.publisherХмельницький національний університет
dc.subjectзапобігання витоку даних
dc.subjectгенетичні алгоритми
dc.subjectеволюційна адаптація
dc.subjectдрейф концепції
dc.subjectповедінкове профілювання
dc.subjectкласифікація документів
dc.subjectdata leakage prevention
dc.subjectgenetic algorithms
dc.subjectevolutionary adaptatio
dc.subjectconcept drift
dc.subjectbehavioral profiling
dc.subjectdocument classificatio
dc.subjectзапобігання витоку даних
dc.subjectгенетичні алгоритми
dc.subjectеволюційна адаптація
dc.subjectдрейф концепції
dc.subjectповедінкове профілювання
dc.subjectкласифікація документів
dc.subject.udc004.056.53:004.89
dc.titleМодель процесу виявлення витоків даних з еволюційною адаптацією
dc.title.alternativeA model of the data leakage detection process with evolutionary adaptation
dc.typeСтаття
Файли
Контейнер файлів
Зараз показуємо 1 - 1 з 1
Назва:
VOTTP_1_2026+270-277.pdf
Розмір:
1.09 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Назва:
license.txt
Розмір:
4.26 KB
Формат:
Item-specific license agreed upon to submission
Опис:
Зібрання