Інформаційна зосередженість змістовності в тексті

dc.contributor.authorДжурабаєв, О.В.
dc.contributor.authorБармак, О.В.
dc.contributor.authorМанзюк, Е.А.
dc.contributor.authorСкрипник, Т.К.
dc.contributor.authorDzhurabaiev, O.V.
dc.contributor.authorBarmak, O.V.
dc.contributor.authorManziuk, E.A.
dc.contributor.authorSkrypnyk, T.K.
dc.date.accessioned2019-10-02T06:24:42Z
dc.date.available2019-10-02T06:24:42Z
dc.date.issued2019
dc.description.abstractВ роботі було запропоновано підхід для дослідження текстової інформації з описом його теоретичної частини. Підхід полягає в дослідженні текстової інформації як сигналу. Було реалізовано інформаційну технологію та проведено дослідження з описом результатів і побудовою графіків тексту.uk_UA
dc.description.abstractNowadays the search for keywords is not complicated, because there are effective algorithms for their search. The most popular algorithms are TF-IDF, the Bag of Words. There are main disadvantages of these methods: the removal of stopwords, the lack of including the position of each word in the text. The aim of research is development of information technology for searching context and test the effectiveness of to search for keywords in the text without removing stopwords and taking into attention the position of each word. Also, the aim of research is the development of information technology to find places of content concentration in the text with minimal time and low CPU usage returns the correct result for a certain range of tasks in the case of compliance with the limits of input data. The paper proposes an approach based on the analogy of the physical phenomenon of the signal, for constructing a "meaning recognizer", which does not require any training base, nor a deep machine analysis of the text, and returns the approximate result. The approach is to normalize the text, build the amplitude and phase vectors, and then plot the dependencies of the calculated parameters and visualize the text. Also described are the results of experiments on the recognition of content in the test data. The results of research have shown that the greatest effectiveness is obtained with a text belonging to a specific category. Information technology for the search of content in text information allows graphically to present text in the form of a three-dimensional model, which makes it possible to identify grouped concentrations. In the final case, this allows us to visually cluster groups of words that are a vector of signs of content concentration. Thus, the textual information is presented in the form of a clustered three-dimensional model based on the content concentration, presented in the form of key words of content. It is revealed the basic characteristics of text information as the basic representation after transformation in the form of numerical dimensional characteristics. This presentation is the basis for further research in the direction of clustering and text classification. The results of the research have confirmed that this method is effective for the case where the text belongs to one category. In case you research several texts of a similar category, you can create a set of words that best characterize these texts (the classifier's core). You can also conduct visually researches of texts as surfaces.uk_UA
dc.identifier.citationІнформаційна зосередженість змістовності в тексті [Текст] / О. В. Джурабаєв, О. В. Бармак, Е. А. Манзюк, Т. К. Скрипник // Вісник Хмельницького національного університету. Технічні науки. – 2019. – №4. – С. 80-83.uk_UA
dc.identifier.urihttps://elar.khmnu.edu.ua/handle/123456789/7737
dc.language.isoukuk_UA
dc.publisherХмельницький національний університетuk_UA
dc.subjectінформаційна технологіяuk_UA
dc.subjectаналіз текстуuk_UA
dc.subjectinformation technologyuk_UA
dc.subjecttext processinguk_UA
dc.subject.udc004.94uk_UA
dc.titleІнформаційна зосередженість змістовності в текстіuk_UA
dc.title.alternativeSearching for context in the textuk_UA
dc.typeСтаттяuk_UA
Файли
Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
5.pdf
Розмір:
1022.14 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Назва:
license.txt
Розмір:
4.26 KB
Формат:
Item-specific license agreed upon to submission
Опис: