Метод поєднання контекстних векторних представлень слів із векторним поданням медичного домену

dc.contributor.authorЧабан, Олександр
dc.contributor.authorChaban, Oleksandr
dc.date.accessioned2025-08-20T09:12:51Z
dc.date.available2025-08-20T09:12:51Z
dc.date.issued2025
dc.description.abstractОсновним викликом у галузі медичних висновків природною мовою (англ. NLI) є досягнення високої точності та надійності автоматизованого аналізу клінічних текстів. Такий аналіз ускладнюється специфікою медичної термінології та потребою врахування контекстуальних знань. У статті подано розв’язок задачі для підвищення якості медичного висновку природною мовою (NLI) через інтеграцію структурованих знань предметної області та інформації про тональність тексту. У роботі запропоновано метод, що поєднує сучасний алгоритм вбудовування знань MultE (застосований до Уніфікованої медичної мовної системи) з моделлю BioELMo, а також інтегрує специфічну для предметної області інформацію про тональність за допомогою MetaMap. Запропонований метод використовує вбудовування BioELMo, інтегровані знання та вектори тональності, оброблені через двоспрямовану LSTM та архітектуру на основі уваги. За набором даних MedNLI метод досяг значення F1-міри в 79,85 %, що перевершило базові моделі. Результати обчислювальних експериментів демонструють, що інтеграція специфічних знань підвищує впровадження NLI у медичній галузі, створюючи в такий спосіб надійну основу для покращення підтримки клінічних рішень.
dc.description.abstractNavigating the intricate logical connections within clinical narratives—a medical natural language inference task—is paramount for advancing applications like AI-assisted clinical decision-making and the automated interpretation of patient records. However, mastering this domain is particularly arduous due to the specialized lexicon, complex conceptual relationships, and subtle semantic variations inherent in medical texts. This research introduces an innovative methodology to elevate medical natural language inference performance by effectively combining structured, field-specific knowledge with insights gleaned from textual sentiment. Our approach capitalizes on MultE, a cutting-edge algorithm for embedding knowledge graphs, to distill profound semantic relationships from the Unified Medical Language System (UMLS). These distilled knowledge representations are then amalgamated with contextual word embeddings generated by BioELMo. To further enrich contextual understanding, sentiment data pertinent to the medical field, extracted via MetaMap, is also integrated. The system architecture processes this composite feature set—BioELMo embeddings augmented by domain knowledge and sentiment vectors—through a bidirectional Long Short-Term Memory (BiLSTM) network, which is subsequently enhanced by an attention mechanism that dynamically assigns importance to different input segments. Validation on the MedNLI benchmark dataset, featuring 14,049 expert-labeled premise-hypothesis pairs, revealed exceptional efficacy. The proposed system achieved 81.14% accuracy, 79.62% recall, an F1-score of 79.85%, and an AUC-ROC of 85.06%, surpassing established baseline techniques. These accomplishments underscore that the deliberate incorporation of specialized knowledge and sentiment cues can dramatically boost natural language inference capabilities in the medical arena, thereby providing a sturdy platform for engineering more dependable and intelligent healthcare solutions.
dc.identifier.citationЧабан О. Метод поєднання контекстних векторних представлень слів із векторним поданням медичного домену / О. Чабан // Вимірювальна та обчислювальна техніка в технологічних процесах. – 2025. – № 2. – С. 297-301.
dc.identifier.urihttps://elar.khmnu.edu.ua/handle/123456789/19297
dc.language.isouk
dc.publisherХмельницький національний університет
dc.subjectмедичні висновки природною мовою
dc.subjectвбудовування знань предметної області
dc.subjectінтелектуальні системи охорони здоров’я
dc.subjectштучний інтелект
dc.subjectглибоке навчання
dc.subjectпідтримка клінічних рішень
dc.subjectclinical text understanding
dc.subjectknowledge-enhanced NLI
dc.subjectsentiment analysis in healthcare
dc.subjectdeep learning for medicine
dc.subjectintelligent decision support
dc.subject.udc004.85:004.912:61
dc.titleМетод поєднання контекстних векторних представлень слів із векторним поданням медичного домену
dc.title.alternativeMethod of combining contextual embbedings with a vector representation of the medical domain
dc.typeСтаття
Файли
Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
VOTTP_2_2025-42.pdf
Розмір:
1.03 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Назва:
license.txt
Розмір:
4.26 KB
Формат:
Item-specific license agreed upon to submission
Опис:
Зібрання