Алгоритм пошуку семантично подібних документів
Вантажиться...
Дата
2013
Автори
Лєнков, Сергій Васильович
Джулій, Володимир Миколайович
Муляр, Ігор Володимирович
Охрамович, Леся Володимирівна
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
В статті проведено аналіз та запропоновано структуру інформаційної системи обробки даних, алгоритм пошуку семантично подібних документів.
На основі результатів дослідження визначено структуру інформаційної системи обробки даних, особливість якої полягає в принципах функціонування підсистем, націлених на підвищення партинентності і релевантності пошуку неструктурованої інформації, а саме: підсистеми діалогового режиму взаємодії з користувачем, підсистеми пошуку семантично подібних документів і підсистеми формування кластерів асоціативно пов'язаних значущих термінів документа.
Запропоновано метод та розроблено алгоритм пошуку семантично подібних документів, особливістю якого є можливість уточнення інформаційної потреби користувача та побудови більш точного пошукового запиту.
В статье проведен анализ и предложена структура информационной системы обработки данных, алгоритм поиска семантически подобных документов. На основе результатов исследования определена структура информационной системы обработки данных, особенность которой заключается в принципах функционирования подсистем, нацеленных на повышение партинентности и релевантности поиска неструктурированной информации, а именно: подсистемы диалогового режима взаимодействия с пользователем, подсистемы поиска семантически подобных документов и подсистемы формирования кластеров ассоциативно связанных значимых терминов документа. Предложен метод и разработан алгоритм поиска семантически подобных документов, особенностью которого является возможность уточнения информационной потребности пользователя и построения более точного поискового запроса.
This paper analyzes the structure and proposed information system data processing algorithm for finding semantically similar documents. Based on the results of the study determined the structure of the information processing systems, a feature which is based on the principles of functioning of subsystems aimed at improving search relevance partynentnosti and unstructured information, namely the subsystem dialog mode user interaction subsystem finding semantically similar documents and subsystems forming clusters associated air knitted important terms of the document. The method and algorithm of finding semantically similar documents, a feature which is the ability to clarify the information needs of users and build a more precise search.
В статье проведен анализ и предложена структура информационной системы обработки данных, алгоритм поиска семантически подобных документов. На основе результатов исследования определена структура информационной системы обработки данных, особенность которой заключается в принципах функционирования подсистем, нацеленных на повышение партинентности и релевантности поиска неструктурированной информации, а именно: подсистемы диалогового режима взаимодействия с пользователем, подсистемы поиска семантически подобных документов и подсистемы формирования кластеров ассоциативно связанных значимых терминов документа. Предложен метод и разработан алгоритм поиска семантически подобных документов, особенностью которого является возможность уточнения информационной потребности пользователя и построения более точного поискового запроса.
This paper analyzes the structure and proposed information system data processing algorithm for finding semantically similar documents. Based on the results of the study determined the structure of the information processing systems, a feature which is based on the principles of functioning of subsystems aimed at improving search relevance partynentnosti and unstructured information, namely the subsystem dialog mode user interaction subsystem finding semantically similar documents and subsystems forming clusters associated air knitted important terms of the document. The method and algorithm of finding semantically similar documents, a feature which is the ability to clarify the information needs of users and build a more precise search.
Опис
Ключові слова
інформаційна система, пошукова системи, неструктурована інформація, information system, search engine, unstructured information
Бібліографічний опис
Алгоритм пошуку семантично подібних документів / С.В. Лєнков, В.М. Джулій, І.В. Муляр, Л.В. Охрамович // Сучасні інформаційні технології у сфері безпеки та оборони. - 2013. - № 2. - С. 25-30.