Метод тематичної класифікації текстів з використанням машинного навчання

dc.contributor.authorМазурець, Олександр Вікторович
dc.contributor.authorВіт, Р.В.
dc.date.accessioned2025-12-15T10:49:43Z
dc.date.available2025-12-15T10:49:43Z
dc.date.issued2025
dc.description.abstractУ роботі запропоновано метод тематичної класифікації текстів з використанням машинного навчання, спрямований на автоматичне виявлення та групування текстових документів за основними темами. Метод базується на тематичному моделюванні LDA у поєднанні з попередньою обробкою текстів (токенізація, лематизація, видалення стоп-слів) та розширенням ключових слів із використанням іменникових сутностей. Запропонований підхід дозволяє визначати кількість тем у корпусі, домінуючу тему для кожного документа та формувати розширений набір ключових слів для кожної теми. Ефективність методу продемонстровано на англомовному наборі новинних текстів, де оптимальну кількість тем визначено на основі показника когерентності моделі, що підтверджує доцільність застосування підходу для аналізу великих обсягів текстової інформації
dc.identifier.citationМазурець О.В., Віт Р.В. Метод тематичної класифікації текстів з використанням машинного навчання. Матеріали XIІI Всеукраїнської науково-практичної конференції «Глушковські читання». Київ, 2024. С. 180-183.
dc.identifier.urihttps://elar.khmnu.edu.ua/handle/123456789/19944
dc.language.isouk
dc.titleМетод тематичної класифікації текстів з використанням машинного навчання
dc.typeСтаття
Файли
Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
moderncyberneticsglushkovreadings2024.pdf
Розмір:
566.27 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Назва:
license.txt
Розмір:
4.26 KB
Формат:
Item-specific license agreed upon to submission
Опис: