Підхід до нейромережевого виявлення мови ворожнечі у зашумлених тексових повідомленнях

Боярчук, І.О.; Молчанова, М.О.

Підхід до нейромережевого виявлення мови ворожнечі у зашумлених тексових повідомленнях

Файли

apkn-2025_corpuspaper-46-51.pdf (454.64 KB)

Дата

2025

Автори

Боярчук, І.О.

Молчанова, М.О.

Анотація

У роботі розглянуто нейромережевий підхід до виявлення мови ворожнечі у зашумлених текстових повідомленнях соціальних мереж і месенджерів, де широко присутні орфографічні відхилення, суржик, емодзі, транслітерація та змішані мовні коди. Метою є підвищення точності та стійкості класифікації за рахунок адаптації моделі до спотворених і навмисно маскованих мовних конструкцій. Запропоновано двоетапний конвеєр: на першому етапі формується контрольовано зашумлений корпус на основі анотованого набору «Hate Speech Detection curated Dataset» з побудовою чистої та зашумленої підвибірок; на другому – здійснюється поетапне донавчання трансформерної моделі типу BERT/RoBERTa з мінімальною нормалізацією тексту. Результати підтверджують доцільність включення параметризованих шумових операторів у навчальний цикл та окреслюють перспективи використання підходу у сервісах модерації контенту й моніторингу інформаційної безпеки.

Бібліографічний опис

Боярчук І.О., Молчанова М.О. Підхід до нейромережевого виявлення мови ворожнечі у зашумлених тексових повідомленнях. Збірник наукових праць за матеріалами XVII Всеукраїнської науково-практичної конференції «Актуальні проблеми комп’ютерних наук АПКН-2025», 14-15 листопада 2025. Хмельницький, 2025. С. 46-51.

URI

https://elar.khmnu.edu.ua/handle/123456789/19877

Зібрання

Кафедра комп’ютерних наук

Повна інформація про документ