Метод тематичної класифікації текстів з використанням машинного навчання
Вантажиться...
Дата
2025
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
У роботі запропоновано метод тематичної класифікації текстів з використанням машинного навчання, спрямований на автоматичне виявлення та групування текстових документів за основними темами. Метод базується на тематичному моделюванні LDA у поєднанні з попередньою обробкою текстів (токенізація, лематизація, видалення стоп-слів) та розширенням ключових слів із використанням іменникових сутностей. Запропонований підхід дозволяє визначати кількість тем у корпусі, домінуючу тему для кожного документа та формувати розширений набір ключових слів для кожної теми. Ефективність методу продемонстровано на англомовному наборі новинних текстів, де оптимальну кількість тем визначено на основі показника когерентності моделі, що підтверджує доцільність застосування підходу для аналізу великих обсягів текстової інформації
Опис
Ключові слова
Бібліографічний опис
Мазурець О.В., Віт Р.В. Метод тематичної класифікації текстів з використанням машинного навчання. Матеріали XIІI Всеукраїнської науково-практичної конференції «Глушковські читання». Київ, 2024. С. 180-183.