Методи виявлення та класифікації кіберзалякувань у текстовому контенті засобами штучного інтелекту

Собко, О.В.; Sobko , Olena

Методи виявлення та класифікації кіберзалякувань у текстовому контенті засобами штучного інтелекту

dc.contributor.author	Собко, О.В.
dc.contributor.author	Sobko , Olena
dc.date.accessioned	2026-05-22T08:40:09Z
dc.date.available	2026-05-22T08:40:09Z
dc.date.issued	2025
dc.description.abstract	Дисертаційна робота присвячена розв’язанню науково-прикладної задачі виявлення та класифікації кіберзалякувань у текстовому контенті засобами штучного інтелекту. Кіберзалякування стали однією з найбільш поширених форм агресивної поведінки в інтернеті в останні роки. За даними досліджень, приблизно 20–40 % підлітків у всьому світі стають жертвами кіберзалякувань, що негативно впливає на їхнє психічне здоров’я та соціальну взаємодію. Одним з найбільш перспективних підходів до виявлення кіберзалякувань є автоматизований аналіз текстового контенту із застосуванням засобів обробки природної мови. Системи з використанням засобів її обробки вже демонструють високі показники у виявленні кіберзалякувань в текстах соціальних мереж та месенджерів. Однак, незважаючи на те, що автоматизовані системи здатні виявляти кіберзалякування у текстовому контенті, існує низка проблем. Зокрема, проблеми етичної та соціокультурної адаптації алгоритмів та залежність від якісного набору даних впливають на результати аналізу. Крім того, такі моделі часто сприймаються як «чорні скриньки», оскільки їхні результати важко інтерпретувати. Відсутність прозорих механізмів пояснення негативно впливає на їхнє впровадження в системи модерації контенту або правозахисні ініціативи. Об’єктом дослідження є процес інтелектуального аналізу текстового контенту для виявлення кіберзалякувань. Предметом дослідження є методи та засоби обробки природної мови для виявлення кіберзалякувань у текстовому контенті. Метою дослідження є підвищення точності та якості виявлення кіберзалякувань у текстовому контенті засобами штучного інтелекту з подальшою інтерпретацією прийнятих рішень. У дисертаційній роботі вперше запропоновано метод оцінювання та коригування репрезентативності датасету за FATE-принципом справедливості, що забезпечує недискримінацію за віковою, гендерною, релігійною приналежністю, що дозволило підвищити якість навчання класифікаторів для виявлення кіберзалякувань. У дисертаційній роботі розроблено новий метод виявлення кіберзалякувань у текстовому контенті, який відрізняється від існуючих двоетапним виявленням кіберзалякувань, що полягає у нейромережевій ідентифікації наявності кіберзалякувань та подальшій нейромережевій мультилейбловій класифікації окремих типів кіберзалякувань, що дало можливість підвищити точність та якість виявлення кіберзалякувань. У дисертаційній роботі також удосконалено метод інтерпретації результатів виявлення кіберзалякувань, який відрізняється від існуючих, можливістю надавати візуальні пояснення для мультилейблової класифікації виявлених типів кіберзалякувань в альтернативних поданнях. Практичне значення отриманих результатів полягає у доведенні теоретичних результатів дисертаційної роботи та розробці інтелектуальної інформаційної системи виявлення та класифікації кіберзалякувань у текстовому контенті засобами штучного інтелекту, що використовує розроблені методи оцінювання та коригування репрезентативності датасету за FATE-принципом справедливості, виявлення і класифікації кіберзалякувань, а також інтерпретації результатів виявлення кіберзалякувань, та дозволяє підвищити точність та якість виявлення кіберзалякувань у текстовому контенті засобами штучного інтелекту й візуально пояснювати прийняті рішення. Розроблена інтелектуальна інформаційна система для виявлення та класифікації кіберзалякувань у текстовому контенті. Інтелектуальна інформаційна система надає можливість оцінювати та коригувати репрезентативність датасетів для навчання моделей машинного навчання за етичними аспектами FATE- принципом справедливості; виявляти та класифікувати типи кіберзалякувань у текстовому контенті. Також інтелектуальна інформаційна система дозволяє отримувати візуальні пояснення для мультилейблової класифікації виявлених типів кіберзалякувань, що сприяє підвищенню довіри до одержаних результатів класифікації типів кіберзалякувань. Результати дисертаційної роботи впроваджено: у діяльності відділу протидії кіберзлочинам у Хмельницькій області Департаменту кіберполіції Національної поліції України; у ПП «Авіві» (довідка про впровадження); у ГО «ІТ-кластер міста Хмельницького» (довідка про впровадження); у ТОВ «Системи для бізнесу 2» (довідка про впровадження); у навчальному процесі Хмельницького національного університету (акт впровадження); при виконанні держбюджетної теми Хмельницького національного університету «Розроблення інформаційної технології прийняття контрольованих людиною критично-безпекових рішень за ментально-формальними моделями машинного навчання» (ДР № 0121U112025) (додаток Б).
dc.description.abstract	The dissertation work is dedicated to solving the scientific and applied problem of detecting and classifying cyberbullying in text content using artificial intelligence. Cyberbullying has become one of the most common forms of aggressive behavior on the Internet in recent years. According to research, approximately 20–40 % of adolescents worldwide become victims of cyberbullying, which negatively affects their mental health and social interaction. One of the most promising approaches to detecting cyberbullying is automated analysis of text content using natural language processing tools. Systems using natural language processing tools have already demonstrated high performance in detecting cyberbullying in texts on social networks and instant messengers. However, despite the fact that automated systems are able to detect cyberbullying in text content, there are a number of problems. In particular, problems of ethical and sociocultural adaptation of algorithms and dependence on a high-quality dataset affect the results of the analysis. In addition, such models are often perceived as “black boxes” because their results are difficult to interpret. The lack of transparent explanation mechanisms negatively affects their implementation in content moderation systems or human rights initiatives. Object of the research is the process of intellectual analysis of text content to detect cyberbullying. Subject of the research is methods and tools of natural language processing to detect cyberbullying in text content. Purpose of the research is to increase the accuracy and quality of detecting cyberbullying in text content using artificial intelligence with subsequent interpretation of the decisions made. In dissertation work first proposed a method for assessing and adjusting the representativeness of a dataset based on the FATE principle of fairness, which ensures non-discrimination by age, gender, and religious affiliation, which allowed improving the quality of training classifiers for detecting cyberbullying. In dissertation work developed a new method for detecting cyberbullying in text content, which differs from existing ones in two-stage detection of cyberbullying, which consists of neural network identification of the presence of cyberbullying and subsequent neural network multi-label classification of individual types of cyberbullying, which made it possible to increase the accuracy and quality of cyberbullying detection. In dissertation work also improves the method of interpreting the results of cyberbullying detection, which differs from existing ones in the ability to provide visual explanations for multi-label classification of detected types of cyberbullying in alternative representations. The practical significance of the results obtained lies in proving the theoretical results of thesis and developing an intelligent information system for detecting and classifying cyberbullying in text content using artificial intelligence, which uses the developed methods for assessing and adjusting the representativeness of the dataset according to the FATE principle of fairness, detecting and classifying cyberbullying, as well as interpreting the results of detecting cyberbullying, and allows increasing the accuracy and quality of detecting cyberbullying in text content using artificial intelligence and visually explaining the decisions made. An intelligent information system has been developed for detecting and classifying cyberbullying in text content. The intelligent information system provides the ability to assess and adjust the representativeness of datasets for training machine learning models according to ethical aspects of the FATE principle of fairness; to detect and classify types of cyberbullying in text content. The intelligent information system also allows for visual explanations for multi-label classification of detected types of cyberbullying, which helps to increase confidence in the obtained results of classifying types of cyberbullying. The results of dissertation work were implemented: in Cybercrime Countermeasures Department in Khmelnytskyi Oblast of Cyberpolice Department of Ukraine National Police, in PE «Avivi» (certificate of implementation); in the NGO «IT Cluster of the City of Khmelnytskyi» (certificate of implementation); in LLC «Systems for Business II» (certificate of implementation); in educational process of Khmelnytskyi National University (act of implementation); in the implementation of the state budget theme of Khmelnytskyi National University «Development of information technology for making human-controlled critical safety decisions using mental-formal machine learning models» (DR No. 0121U112025) (Appendix B).
dc.identifier.citation	Собко О. В. Методи виявлення та класифікації кіберзалякувань у текстовому контенті засобами штучного інтелекту : дис. ... д-ра філософії : 122 Комп'ютерні науки. Хмельницький, 2025. 174,c.
dc.identifier.uri	https://elar.khmnu.edu.ua/handle/123456789/21122
dc.language.iso	uk
dc.publisher	Хмельницький національний університет
dc.subject	кіберзалякування
dc.subject	типи кіберзалякувань
dc.subject	етичні аспекти
dc.subject	FATE-принципи
dc.subject	репрезентативність датасетів
dc.subject	BERT
dc.subject	LIME
dc.subject	інтерпретація результатів
dc.subject	поясненність
dc.subject	cyberbullying
dc.subject	types of cyberbullying
dc.subject	ethical aspects
dc.subject	FATE principles
dc.subject	BERT
dc.subject	LIME
dc.subject	interpretation of results
dc.subject	explainability
dc.subject.udc	004.8
dc.title	Методи виявлення та класифікації кіберзалякувань у текстовому контенті засобами штучного інтелекту
dc.title.alternative	Methods for detecting and classifying cyberbullying in text content using artificial intelligence
dc.type	Дисертація

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Дисертація Собко.pdf.pdf
Розмір:: 5.51 MB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 4.26 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Дисертації