Інформаційна технологія автоматизованого визначення семантичних термінів в елементах навчальних матеріалів

Вантажиться...
Ескіз
Дата
2018
Автори
Мазурець, О.В.
Mazurets, O.
Назва журналу
Номер ISSN
Назва тому
Видавець
Хмельницький національний університет
Анотація
У статті досліджено проблему автоматизації побудови семантичної моделі навчального курсу у вигляді онтології. Встановлено, що ключовим аспектом побудови онтології навчального курсу є визначення множини ключових семантичних термінів у контенті елементів навчальних матеріалів. Запропоновано інформаційну технологію автоматизованого визначення множини ключових семантичних термінів у контенті елементів навчальних матеріалів, що ґрунтується на пошуку використаних фраз у тексті та дисперсійній оцінці важливості слів. Відповідно до даної інформаційної технології, на основі введених даних у вигляді файлу навчального матеріалу автоматизовано формується структура електронного документу для вибору елементу для аналізу, після чого проводиться сегментація за фразами і термінами, терміни лематизуються та їх множина компактифікується. На основі автоматично лематизованого фрагменту тексту проводиться пошук та дисперсійне оцінювання важливості слів у обраному фрагменті, після чого оцінюється важливість термінів, а їх кількість обмежується відповідно до коефіцієнту щільності ключових слів. Вхідними даними інформаційної технології є електронний документ навчального матеріалу та обраний елемент для аналізу, вихідними даними є відповідна множина ключових семантичних термінів навчального матеріалу. Розглянуто тестовий програмний продукт, що дозволяє автоматизовано визначати множину ключових семантичних термінів за даною інформаційною технологією. Проведені дослідження підтвердили можливість ефективно формувати множини ключових семантичних термінів елементів навчальних матеріалів з середніми показниками точності пошуку до 73,2% та повноти пошуку до 69,7%. Аналіз отриманих результатів виявив, що відсутність програмно визначених термінів у множині автора не завжди характеризує недолік розглядуваної технології. Деякі семантично важливі терміни автори суб’єктивно ігнорують, в той час як іншу категорію складають поняття, на яких автори акцентують надмірну увагу попри їх другорядність в рамках матеріалу, що викладається. Встановлена ефективність запропонованої інформаційної технології сприяє її використанню для вирішення ряду актуальних задач, таких як семантична допомога при створенні тестів, автоматизація формування рефератів та анотацій до елементів навчальних матеріалів, оцінка відповідності навчальних матеріалів змістовим вимогам, оцінка відповідності наборів тестових завдань навчальним матеріалам тощо.
The problem of automation of the construction of semantic model of educational courses in the form of an ontology was investigated in the article. It has been established, that the key aspect of constructing of the ontology of educational courses is to make the set of key semantic terms of the contents of educational material elements. The information technology of automated determination of key semantic terms in the content of educational materials elements is considered, which is based on the search of used phrases and the disperse evaluation of words importance. In accordance with this information technology, on the basis of the data entered as an educational material file, the structure of a electronic document is automatically formed to select an element for analysis, after which segmentation is performed by phrases and terms, the terms are lemmatized and set of them is compactified. On the basis of automatically lemmatized fragment of text, a search and disperse evaluation of the importance of words in the chosen fragment is performed, after which the terms importance is calculated, and their number is limited by the value of the keyword density ratio. Input data of information technology is a electronic document of educational material, the output data is the corresponding set of key semantic terms of the educational material. The results of the analysis of the regularities of the existing sets of key semantic terms are also described. The test program that allows to automate the determination of sets of key semantic terms using this information technology is considered. Conducted investigations confirmed the possibility of effectively forming the set of key semantic terms of educational materials, average evaluated search precision metrics 73.2% and search recall 69.7%. The analysis of the results showed that the lack of programmed terms in the author's set does not always characterize the lack of considered technology. Some semantically important terms are subjectively ignored by the authors, while another category is made up of concepts in which the authors emphasize excessive attention to their secondary character within the framework of the material being taught. The established effectiveness of the proposed technology allows use it to solution a number of urgent tasks, such as semantic assistance in creating tests, automation of the creation of abstracts and annotations to the elements of educational materials, determination the conformity of educational materials to content requirements, determination the conformity of sets of test tasks to educational materials, etc.
Опис
Ключові слова
онтологія, ключові терміни, ключові слова, електронний документ, навчальні матеріали, дисперсійна оцінка, ontology, key terms, keywords, electronic document, educational materials, disperse evaluation
Бібліографічний опис
Мазурець, О.В. Інформаційна технологія автоматизованого визначення семантичних термінів в елементах навчальних матеріалів [Текст] / О. В. Мазурець // Вісник Хмельницького національного університету. Технічні науки. – 2018. – № 3. – С. 223-230.