Автоматизоване виявлення та класифікація неоднозначностей у вимогах до програмного забезпечення ІТ-проєктів з використанням великих мовних моделей та RAG-технологій

Проблема забезпечення якості вимог на ранніх етапах життєвого циклу розробки набуває критичного значення для успіху програмних проєктів, адже наявність лінгвістичних та семантичних неоднозначностей у специфікаціях є однією з головних причин виникнення дефектів, перевитрат бюджету та зривів термінів реалізації. Ручне рецензування документації є надмірно трудомістким та суб’єктивним процесом, а традиційні автоматизовані інструменти на основі правил часто генерують високий рівень хибних спрацювань через нездатність розуміти контекст. Використання великих мовних моделей відкриває нові можливості для семантичного аналізу тексту, проте їх пряме застосування ускладнюється схильністю до галюцинацій та ігноруванням специфічної термінології проєкту. У статті запропоновано гібридний метод виявлення неоднозначностей у вимогах до програмного забезпечення, що базується на інтеграції великих мовних моделей із технологією пошукового доповнення генерації (RAG). Запропонований підхід ґрунтується на двоагентній архітектурі, яка передбачає послідовну взаємодію агента-ідентифікатора для первинної фільтрації вимог та агента-класифікатора для їх глибокої семантичної типізації згідно зі стандартом IEEE 830. Метод охоплює такі етапи, як сегментація тексту, динамічне збагачення запитів контекстом із бази знань проєкту, застосування стратегії ланцюжка міркувань для генерації пояснень та структурний парсинг результатів. Експерименти проведено на спеціалізованому датасеті з домену телекомунікацій, що містить 1983 вимоги. Отримані результати засвідчили перевагу розробленого гібридного методу на базі моделі Flan-T5-Large над базовими підходами (ZeroShot та Few-Shot): метод забезпечує Precision 87%, повноту Recall 91% та F1-score 89%. Додатково підтверджено ефективність використання RAG для зниження кількості хибних спрацювань на вузькоспеціалізованій технічній лексиці та продемонстровано здатність системи надавати інтерпретовані пояснення виявлених дефектів. Результати доводять, що інтеграція контекстноорієнтованих LLM-агентів істотно підвищує рівень автоматизації та надійності процесу аудиту вимог у сучасних середовищах розробки
The problem of ensuring the quality of requirements in the early stages of the development life cycle is of critical importance for the success of software projects, since the presence of linguistic and semantic ambiguities in specifications is one of the main causes of defects, budget overruns and disruptions in implementation deadlines. Manual review of documentation is an excessively laborious and subjective process, and traditional automated rule-based tools often generate a high level of false positives due to the inability to understand the context. The use of large language models opens up new opportunities for semantic text analysis, but their direct application is complicated by the tendency to hallucinations and ignoring specific project terminology. The article proposes a hybrid method for detecting ambiguities in software requirements, which is based on the integration of large language models with the technology of search-addition generation (RAG). The proposed approach is based on a two-agent architecture, which involves the sequential interaction of an identifier agent for initial filtering of requirements and a classifier agent for their deep semantic typing according to the IEEE 830 standard. The method includes such stages as text segmentation, dynamic enrichment of queries with context from the project knowledge base, application of the Chain-of-Thought strategy for generating explanations, and structural parsing of results. The experiments were conducted on a specialized dataset from the telecommunications domain containing 1983 requirements. The results obtained demonstrated the superiority of the developed hybrid method based on the Flan-T5-Large modelover the basic approaches (Zero-Shot and Few-Shot): the method provides Precision 87%, Recall completeness 91%, and F1-score 89%. Additionally, the effectiveness of using RAG to reduce the number of false positives on highly specialized technical vocabulary is confirmed and the system's ability to provide interpreted explanations of detected defects is demonstrated. The results prove that the integration of context-oriented LLM agents significantly increases the level of automation and reliability of the requirements audit process in modern development environments.

Ключові слова

вимоги до програмного забезпечення, неоднозначність, великі мовні моделі, RAG, Flan-T5, Chain-ofThought, автоматизація перевірки, software requirements, ambiguity, large language models, RAG, Flan-T5, Chain-of-Thought, verification automation

Бібліографічний опис

Вонсович Б., Багрій Р., Скрипник Т., Пасічник О. Автоматизоване виявлення та класифікація неоднозначностей у вимогах до програмного забезпечення ІТ-проєктів з використанням великих мовних моделей та RAG-технологій // Вимірювальна та обчислювальна техніка в технологічних процесах. 2026. № 1. С. 436-442.