Модель процесу виявлення витоків даних з еволюційною адаптацією
Вантажиться...
Дата
2026
Назва журналу
Номер ISSN
Назва тому
Видавець
Хмельницький національний університет
Анотація
У роботі запропоновано узагальнену модель процесу виявлення витоків даних з еволюційною адаптацією,
побудовану на інтеграції трьох функціональних складових: класифікації документів за рівнем конфіденційності на основі
генетичного алгоритму з IF-THEN правилами, виявлення дрейфу концепції через двовіконний статистичний детектор (критерій
Колмогорова-Смірнова та t-тест) й адаптивного поведінкового профілювання користувачів із експоненціальним забуванням.
Описано архітектуру DLP-системи. Показано механізм зворотного зв’язку, за яким детектор дрейфу підсилює мутацію в
генетичному алгоритмі, а поведінковий модуль коригує порогові значення. Експериментальна оцінка на корпусі розсекречених
урядових документів DISC (2 450 документів, три рівні конфіденційності) підтверджує: GA-класифікатор досягає F1 = 0,867,
поступаючись ансамблевим методам лише на 5-6 %. при повній інтерпретованості правил, механізм адаптації підвищує
prequential F1 на 7,6 %, а поведінковий детектор із генетичною оптимізацією ваг забезпечує FPR = 0,023. Модель зберігає
повну інтерпретованість рішень, придатну для аудиту та верифікації експертами з безпеки.
The paper presents a generalized model of the data leakage detection process with evolutionary adaptation, based on the integration of three functional components: document classification using a genetic algorithm with IF–THEN rules, concept drift detection through a dual-window statistical detector (Kolmogorov–Smirnov test and Student’s t-test), and adaptive user behavioral profiling with exponential forgetting. The architecture of the proposed DLP system is described as a modular structure combining content analysis, behavioral monitoring, and adaptive parameter control. A feedback mechanism is implemented to ensure dynamic adaptation. When the drift detector identifies statistically significant distributional changes in input features, it increases the mutation rate of the genetic algorithm, thereby accelerating the evolution of classification rules. Simultaneously, the behavioral profiling module adjusts decision thresholds according to updated user activity patterns. This coordinated interaction enables the system to adapt to evolving data characteristics and usage scenarios without requiring architectural modifications or retraining from scratch. Experimental evaluation was conducted on the DISC corpus of declassified government documents (2,450 documents across three security levels). Results demonstrate that the genetic algorithm–based classifier achieves an F1-score of 0.867, trailing ensemble methods by only 5–6% while preserving full interpretability of decision rules. The evolutionary adaptation mechanism increases prequential F1 by 7.6%, confirming its effectiveness under streaming conditions with potential distribution shifts. In addition, the behavioral anomaly detector with genetically optimized feature weights achieves a low false positive rate (FPR = 0.023), improving operational reliability. The proposed model maintains complete transparency of classification logic, making it suitable for audit, compliance verification, and expert validation in security-sensitive environments. Overall, the integration of evolutionary learning, statistical drift monitoring, and adaptive behavioral analysis forms a robust, interpretable, and practically deployable framework for data leakage prevention systems operating in dynamic organizational contexts
The paper presents a generalized model of the data leakage detection process with evolutionary adaptation, based on the integration of three functional components: document classification using a genetic algorithm with IF–THEN rules, concept drift detection through a dual-window statistical detector (Kolmogorov–Smirnov test and Student’s t-test), and adaptive user behavioral profiling with exponential forgetting. The architecture of the proposed DLP system is described as a modular structure combining content analysis, behavioral monitoring, and adaptive parameter control. A feedback mechanism is implemented to ensure dynamic adaptation. When the drift detector identifies statistically significant distributional changes in input features, it increases the mutation rate of the genetic algorithm, thereby accelerating the evolution of classification rules. Simultaneously, the behavioral profiling module adjusts decision thresholds according to updated user activity patterns. This coordinated interaction enables the system to adapt to evolving data characteristics and usage scenarios without requiring architectural modifications or retraining from scratch. Experimental evaluation was conducted on the DISC corpus of declassified government documents (2,450 documents across three security levels). Results demonstrate that the genetic algorithm–based classifier achieves an F1-score of 0.867, trailing ensemble methods by only 5–6% while preserving full interpretability of decision rules. The evolutionary adaptation mechanism increases prequential F1 by 7.6%, confirming its effectiveness under streaming conditions with potential distribution shifts. In addition, the behavioral anomaly detector with genetically optimized feature weights achieves a low false positive rate (FPR = 0.023), improving operational reliability. The proposed model maintains complete transparency of classification logic, making it suitable for audit, compliance verification, and expert validation in security-sensitive environments. Overall, the integration of evolutionary learning, statistical drift monitoring, and adaptive behavioral analysis forms a robust, interpretable, and practically deployable framework for data leakage prevention systems operating in dynamic organizational contexts
Опис
Ключові слова
запобігання витоку даних, генетичні алгоритми, еволюційна адаптація, дрейф концепції, поведінкове профілювання, класифікація документів, data leakage prevention, genetic algorithms, evolutionary adaptatio, concept drift, behavioral profiling, document classificatio, запобігання витоку даних, генетичні алгоритми, еволюційна адаптація, дрейф концепції, поведінкове профілювання, класифікація документів
Бібліографічний опис
Віжевський П., Cавенко О. Модель процесу виявлення витоків даних з еволюційною адаптацією // Вимірювальна та обчислювальна техніка в технологічних процесах. 2026. № 1. С. 270-277.