Теоретичні та прикладні засади інтелектуальної інформаційної технології отримання довірчих рішень за людиноцентрованим підходом
Вантажиться...
Дата
2022
Автори
Манзюк, Едуард Андрійович
Manziuk, E.A.
Назва журналу
Номер ISSN
Назва тому
Видавець
Хмельницький національний університет
Анотація
У дисертаційній роботі вирішено актуальну науково-прикладну проблему недостатнього рівня довіри до інтелектуальних інформаційних технологій в частині прийняття ними рішень на практичному рівні шляхом розроблення теоретичних та прикладних засад інтелектуальної інформаційної технології отримання довірчих рішень за людиноцентрованим підходом, яка забезпечує довіру до рішень, отриманих інтелектуальними інформаційними системами відповідно до сукупності етичних принципів.
Об‘єктом дослідження є процес забезпечення довіри до інтелектуальних інформаційних технологій.
Предметом дослідження є методи та засоби інтелектуальної інформаційної технології отримання довірчих рішень за людиноцентрованим підходом.
Методи дослідження: в межах дисертаційної роботи визначено ряд завдань, для вирішення яких було використано методи аналізу та моделювання процесів; теорію систем; методи онтологічного моделювання та порівняння; методи реляційної алгебри для моделювання довіри до інтелектуальних інформаційних технологій; методи класифікації та кластеризації; теорію множин; теорію моделювання для розробки моделей групового отримання рішень з використанням методів агрегації корельованих рішень та формування областей даних відповідно до показників довіри; методів теорії множин; теорії графів; методи кластерного
3
аналізу для розробки моделі та методу аналізу ознак даних відповідно до виявлення викидів на характерних множинах щодо приналежності ознак і формування гіперпросторового групування даних мінімізацією втрати інформативності.
Проведено аналіз та досліджено поняття довіри до інтелектуальних інформаційних технологій на основі розробленої онтології довіри. Це дозволило визначити шляхом декомпозиції основні структурні елементи і співвідношення між ним та в подальшому, на основі розроблених методів порівняння, через встановлення ступеня відповідностей, визначити узгодженість онтології довіри щодо структурованого домену. За результатами проведеного аналізу визначені основні фактори та властивості, необхідні для розробки методів із забезпечення довіри до інтелектуальних інформаційних технологій на рівні систем прийняття рішень та аналізу ознак даних. Це дало можливість сформувати множину характеристик систем прийняття рішень, які в подальшому лягли в основу розробки нових методів для формування систем прийняття рішень і дають змогу генерувати рішення відповідно до визначених показників довіри.
У межах дисертаційної роботи запропоновано поняття довіри до інтелектуальних інформаційних технологій в частині прийняття ними рішень, яке базується на теоретико-множинному підході і в подальшому лягло в основу формування множини вимог до програмного рівня інтелектуальних інформаційних технологій, а саме: методів формування систем прийняття рішень з генерації довірчих рішень.
Здійснено декомпозицію поняття довіри та розроблено метод визначення відповідності складових онтології довіри до інших узагальнень етичних принципів довіри. В основі методу лежить об‘єднання трьох незалежних рівнів (синтаксичного, структурного, семантичного) встановлення відповідності елементів множини декомпозиції та складових структурованого домену, який в межах роботи представлено у вигляді структурованого корпусу узагальнених документів світового дискурсу
людиноцентрованого підходу етичних інтелектуальних інформаційних технологій за поняттям довіри. Розроблено структурний рівень встановлення відповідності елементів множини декомпозиції та складових структурованого домену, який визначає відповідність на рівні структурних доменних та міждоменних зв‘язків. Фактором відповідності визначено повноту формування подібних структур домену порівняння відносно базового домену дослідження. Визначальними елементами є міждоменні зв‘язки структурних частин внутрішньодоменної множини зв‘язків. Використання запропонованого методу дозволило забезпечити встановлення відповідності елементів порівняння на основі множин зв‘язків. Розроблено семантичний рівень встановлення відповідності елементів множини декомпозиції та складових структурованого домену, який визначає відповідність на рівні змістовних складових елементів порівняння. Елемент встановлення відповідності в домені порівняння формується як метасутність у вигляді кортежу сутностей повної приналежності або часткової приналежності на рівні множини властивостей, які узагальнюються сутністю. Для підвищення рівня семантичної відповідності, властивості було визначено як узагальнення множини текстових дескрипторів з домену порівняння – бази знань області дискурсу. Це дало можливість виділити аспекти властивостей та сформувати сутності в їх межах, підвищуючи таким чином дискретність семантичного встановлення ступеня відповідності на рівні складових властивостей та формуючи ієрархії узагальнення.
Базуючись на цьому, розроблено метод сегментування даних за агрегацією роботи ансамблю СПР, який, взявши за основу групованість систем прийняття рішень ансамблевого підходу, дозволяє отримувати рішення за ознаками довіри, які було визначено на основі декомпозиції концепту довіри, та сформувати області довірчих рішень, а також забезпечувати належні результати за показниками якості. Запропоновано метод формування ансамблю систем прийняття рішень. Розроблено критерії відбору систем прийняття рішень для формування ансамблів систем прийняття рішень, які дозволяють ефективно використати як здатність систем прийняття рішень до узагальнення, так і здатність індивідуальної системи прийняття рішень враховувати інформативності окремих складнокласифікованих даних, які визначають необхідність залучення кожної системи прийняття рішень в ансамбль як форми прийняття групового рішення. Така форма прийняття рішення дозволяє врахувати переваги методів колективного прийняття рішень та індивідуальні переваги кожної системи прийняття рішень, які формують ансамбль та сегментувати рішення щодо даних за ознаками довіри. Запропоновано метод групового прийняття рішень ансамблем систем прийняття рішень. Виділяється сегмент складнокласифікованих даних, які відносно загальної сукупності є нетиповими, та рішення ансамблю стосовно яких мають низький ступінь довіри. Рішення щодо такого сегмента даних формуються на основі виділення підмножин систем прийняття рішень з ансамблю та групування за кореляцією ймовірностей рішень систем прийняття рішень, що дозволило максимізувати оцінки якості.
Запропоновано метод проєкції сформованої людиною ментальної моделі прийняття рішень на машинний рівень виконання та утворення формального представлення, яке використовують обчислювальні системи. Метод був розроблений з метою забезпечення складових довіри, які визначаються стейкхолдерами, тобто зацікавленою стороною (людиною) і дозволяє ментальне представлення прийняття рішення, сформоване людиною з використанням візуальної аналітики, спроєктувати на рівень формального представлення для безпосереднього використання обчислювальною системою на машинному рівні. Таким чином, рівень довіри до представлення підвищується значною мірою, оскільки представлення (ментальне) створюється безпосередньо самою людиною і в подальшому у вигляді формального представлення проєктується на машинний рівень. Метод реалізований в межах запропонованої концепції розділення сфери створення
представлення (аналітичні можливості людини) та сфери практичного використання (обчислювальні можливості машини).
Для сегмента слабороздільної інформації, з метою формування максимальної роздільності, розроблено метод аналізу складнокласифікованих даних. Метод дозволяє в гіперпросторі ознак забезпечувати формування групованості даних з мінімальними втратами інформативності. Це забезпечує локальне зміщення підгрупи даних для покращення роздільності. Просторове зміщення здійснюється в зоні розділення даних та має локальний характер. При цьому створюються умови незміщення загальних множин даних, що не вносить зміну інформативності в головний сегмент даних. В межах множини локальних даних зони розділення визначаються ознаки, які є нетиповими або викидами відносно групи ознак дослідження та визначають розмежованість даних. Множини ознак визначаються на основі формування кортежів ознак послідовним виключенням та встановленням рівня впливу ознаки на розмежованість даних за їхньою групованістю. Визначений рівень впливу дозволяє виділити найбільш впливові ознаки та характеризувати їх як викиди, тобто ті ознаки, наявність яких в локальних приграничних даних зони розмежування найбільшою мірою впливають на просторове групування даних. Метод дозволяє визначати множини ознак за рівнем впливовості та сферою поширення серед даних.
Розроблений метод визначення нетипових ознак складнокласифікованих даних згідно з їх паралельною обробкою дозволяє сформувати кортежі ознак на локальних приграничних даних зони розмежування, який дає можливість на малих даних провести дослідження впливу всіх ознак з виділенням характерних множин впливу. Визначаються усі можливі шляхи максимізації розмежованості локальних приграничних даних, які представлені у формі деревоподібних структур кортежів з кінцевим пошуком локального максимуму. Загальна множина дерев кортежів ознак представлена лісом кортежів ознак. Оскільки досліджуються усі шляхи, виділяються гілки дерев кортежів ознак, які максимізують розмежованість локальних даних, тобто приводять до знаходження глобального максимуму. В межах цих гілок кортежів визначаються найбільш впливові ознаки.
The thesis solves the current scientific and applied lack of trust in intelligent information technology in terms of their decision-making at the practical level and its decisionn by developing theoretical and applied principles of intelligent information technology to obtain trustworthy decisions based on human-centered approach. in accordance with a set of ethical principles. The object of research is the process of ensuring trust in intelligent information technologies. The subject of research is the methods and means of intelligent information technology for obtaining trust decisions in a human-centered approach. Research methods: within the thesis a number of tasks were defined for the decision of which methods of analysis and modeling of processes were used; systems theory; methods of ontological modeling and comparison; relational algebra methods for modeling trust in intelligent information technologies; methods of classification and clustering; set theory; modeling theories for the development of models of group decision-making using methods of aggregation of correlated decisions and the formation of data areas in accordance with trust indicators; methods of set theory; graph theory; methods of cluster analysis to develop a model and method of analysis of data characteristics in accordance with the detection of outlier on characteristic sets for the affiliation of characteristics and the formation of hyperspace grouping of data to minimize the loss of information. The analysis of the concept of trust in intelligent information technologies on the basis of the developed ontology of trust is carried out. This allowed determining, by decomposition, the main structural elements and the relationship between it and furthering on the basis of developed methods of alignment, by establishing the degree of correspondence to determine the alignment of the trust ontology for the structured domain. Based on the results of the analysis, the main factors and properties necessary for the development of methods to trust in intelligent information technology at the level of decision-making systems and analysis of data characteristics are identified. This made it possible to form a set of characteristics of decision-making systems, which later formed the basis for the development of new methods for the formation of decision-making systems and allow to generate decisions in accordance with certain indicators of trust. The thesis proposes the concept of trust in intelligent information technology, which is based on the theoretical-sets approach and later formed the basis for the formation of requirements set for the software level of intelligent information technology, namely methods of forming decision-making systems for generating trust decisions. The decomposition of the concept of trust is carried out and the method of determining the components concept of the trust and the importance of the concept elements is developed. The method is based on a combination of three independent methods (syntactic, structural, semantic) to alignment of elements of the set of decomposition and components of the structured domain, which is presented as a structured body of generalized documents of the world discourse of human-centered approach to ethical intelligent information technology. A method of structural alignment of elements of set of decomposition and components to the structured domain which defines alignment at the level of structural domain and interdomain links is developed. The alignment factor determined the completeness of the formation structures of the comparison domain in relation to the baseline domain of the study. The defining elements are the interdomain links of the structural parts of the intradomain set of links. The use of the proposed method allowed ensuring the elements alignment of the comparison on the basis of sets of links. The improved method of semantic alignment of decomposition set elements and components to the structured domain defines alignment at the level of semantic components of comparison elements. The alignment element in the comparison domain is formed as a meta-entity in the form of a tuple of entities belonging to full or partial membership at the level of the properties set that are generalized to the entity. To increase the level of semantic alignment, properties were defined as the generalization of text descriptors from set of the domain of alignment - the knowledge base of the discourse. This made it possible to highlight aspects of properties and form entities within them, thus increasing the discreteness semantic alignment of the conformity degree at the level of component properties and forming a hierarchy of generalizations. Based on this, a method was developed, which ground on the grouping of decision-making systems of the ensemble approach allows to obtain decisions on the basis of trust, which was determined on the basis of trust decomposition and form areas of trust, as well as provide appropriate results. Criteria for selecting decision-making systems for ensemble formation are proposed, which allow to effectively using both the ability of decision-making systems to generalize and the ability of individual decision-making systems to take into account the informativeness of individual complex data. This form of decision-making allows to take into account the advantages of collective decision-making methods and the individual advantages of each decision-making system that form an ensemble and segment decisions on data on the basis of trust. There is a segment of complex data, which in relation to the general data are atypical and the decisions of the ensemble in regards of which have a low degree of trust. Decisions on this segment of data are formed on the basis of the selection of decision-making systems subsets from the ensemble and grouping by correlation of the decisions probabilities of decision-making systems, which allowed to maximize quality estimates. The method of designing a mental representation formed by a human at the machine level and the formation of a formal model, which is used by computer systems, is proposed. The method was developed to provide the components of trust that are determined by stakeholders and allows mental model of human decision-making using visual analytics to design at the level of formal model for direct use by computer computing at the machine level. Thus, the level of trust in the model is greatly increased because the mental model is created directly by human and then in the form of a formal model is projected to the machine level. The method is implemented within the proposed concept of mental model (analytical capabilities of human) and formal model (computational capabilities of the machine). For the difficult-to-classify information in order to form the maximum separation, a method of analysis of data features was developed. The method allows in the hyperspace of features to ensure the formation of grouping of data with minimal loss of information. This allows for a local offset of the data subgroup to improve separation. Spatial displacement takes place in the data separation zone and is local in nature. This ensures that the general data sets are not shifted in space, which does not change the informativeness of the main data segment. Within the set of local data of the separation zone, features are identified that are atypical or outlier relative to the group of research features and determine the delimitation of the data. The sets of features are determined on the basis of the formation of tuples of features by successive exclusion and establishing the level of influence of the data delimitation feature by their grouping. The determined level of impact allows identifying the most influential features and characterizing them as outlier, i.e. those features whose presence in the local boundary data of the demarcation zone has the greatest impact on the spatial grouping of data. The method allows determining the set of features by the level of influence and scope among the data. A method of parallel formation of features on local boundary data of the demarcation zone has been developed, which allows to study the influence of all features on small data with the selection of features sets of influence. All possible ways of maximizing the delimitation of local boundary data are determined, which are presented in the form of tree structures of tuples with the final search for the local maximum. The total number of trees of feature tuples is represented by a forest of feature tuples. As all pathways are explored, the branches of feature tuple trees are highlighted, which maximize the delimitation of local data, i.e. lead to finding a global maximum. Within these branches of tuples the most influential signs are defined. The practical importance of the research and the results obtained. The proposed methods of obtaining decisions with trust indicators and qualitative indicators have gained practical implementation, which allows obtaining many trust decisions, using an ensemble approach and getting the necessary discriminant differentiation of decisions by quality indicators. It has become possible to obtain sets of features for low-discharge data that determine the maximum possible delimitation and to establish a measure of features influence on the differentiance of data for the features of a particular target group. The results of the practical research permitted and the components of the trust concept with the projection on the software level of decision-making systems. The practical application of the developed methods of making decision-making systems allowed distinguishing a segment of data, the decisions on which are characterized by a high degree of trust and a segment of atypical data near the demarcation zone. At the same time, it was possible to obtain high quality of delimitation of compound data and methods of analysis of signs with the release of outliers. The developed methods can be applicable within a wide range of problems related to the sphere of intelligent information systems, as they allow obtaining high quality results. Of particular importance is the practical application of developed methods in intelligent information technologies for the areas of important and critical importance that require high-cost decisions. Spheres: security, socially significant, military, financial, which require critical decisions for society and the lives of people with the use of intelligent information technologies are those areas where intellectual information systems can be used.
The thesis solves the current scientific and applied lack of trust in intelligent information technology in terms of their decision-making at the practical level and its decisionn by developing theoretical and applied principles of intelligent information technology to obtain trustworthy decisions based on human-centered approach. in accordance with a set of ethical principles. The object of research is the process of ensuring trust in intelligent information technologies. The subject of research is the methods and means of intelligent information technology for obtaining trust decisions in a human-centered approach. Research methods: within the thesis a number of tasks were defined for the decision of which methods of analysis and modeling of processes were used; systems theory; methods of ontological modeling and comparison; relational algebra methods for modeling trust in intelligent information technologies; methods of classification and clustering; set theory; modeling theories for the development of models of group decision-making using methods of aggregation of correlated decisions and the formation of data areas in accordance with trust indicators; methods of set theory; graph theory; methods of cluster analysis to develop a model and method of analysis of data characteristics in accordance with the detection of outlier on characteristic sets for the affiliation of characteristics and the formation of hyperspace grouping of data to minimize the loss of information. The analysis of the concept of trust in intelligent information technologies on the basis of the developed ontology of trust is carried out. This allowed determining, by decomposition, the main structural elements and the relationship between it and furthering on the basis of developed methods of alignment, by establishing the degree of correspondence to determine the alignment of the trust ontology for the structured domain. Based on the results of the analysis, the main factors and properties necessary for the development of methods to trust in intelligent information technology at the level of decision-making systems and analysis of data characteristics are identified. This made it possible to form a set of characteristics of decision-making systems, which later formed the basis for the development of new methods for the formation of decision-making systems and allow to generate decisions in accordance with certain indicators of trust. The thesis proposes the concept of trust in intelligent information technology, which is based on the theoretical-sets approach and later formed the basis for the formation of requirements set for the software level of intelligent information technology, namely methods of forming decision-making systems for generating trust decisions. The decomposition of the concept of trust is carried out and the method of determining the components concept of the trust and the importance of the concept elements is developed. The method is based on a combination of three independent methods (syntactic, structural, semantic) to alignment of elements of the set of decomposition and components of the structured domain, which is presented as a structured body of generalized documents of the world discourse of human-centered approach to ethical intelligent information technology. A method of structural alignment of elements of set of decomposition and components to the structured domain which defines alignment at the level of structural domain and interdomain links is developed. The alignment factor determined the completeness of the formation structures of the comparison domain in relation to the baseline domain of the study. The defining elements are the interdomain links of the structural parts of the intradomain set of links. The use of the proposed method allowed ensuring the elements alignment of the comparison on the basis of sets of links. The improved method of semantic alignment of decomposition set elements and components to the structured domain defines alignment at the level of semantic components of comparison elements. The alignment element in the comparison domain is formed as a meta-entity in the form of a tuple of entities belonging to full or partial membership at the level of the properties set that are generalized to the entity. To increase the level of semantic alignment, properties were defined as the generalization of text descriptors from set of the domain of alignment - the knowledge base of the discourse. This made it possible to highlight aspects of properties and form entities within them, thus increasing the discreteness semantic alignment of the conformity degree at the level of component properties and forming a hierarchy of generalizations. Based on this, a method was developed, which ground on the grouping of decision-making systems of the ensemble approach allows to obtain decisions on the basis of trust, which was determined on the basis of trust decomposition and form areas of trust, as well as provide appropriate results. Criteria for selecting decision-making systems for ensemble formation are proposed, which allow to effectively using both the ability of decision-making systems to generalize and the ability of individual decision-making systems to take into account the informativeness of individual complex data. This form of decision-making allows to take into account the advantages of collective decision-making methods and the individual advantages of each decision-making system that form an ensemble and segment decisions on data on the basis of trust. There is a segment of complex data, which in relation to the general data are atypical and the decisions of the ensemble in regards of which have a low degree of trust. Decisions on this segment of data are formed on the basis of the selection of decision-making systems subsets from the ensemble and grouping by correlation of the decisions probabilities of decision-making systems, which allowed to maximize quality estimates. The method of designing a mental representation formed by a human at the machine level and the formation of a formal model, which is used by computer systems, is proposed. The method was developed to provide the components of trust that are determined by stakeholders and allows mental model of human decision-making using visual analytics to design at the level of formal model for direct use by computer computing at the machine level. Thus, the level of trust in the model is greatly increased because the mental model is created directly by human and then in the form of a formal model is projected to the machine level. The method is implemented within the proposed concept of mental model (analytical capabilities of human) and formal model (computational capabilities of the machine). For the difficult-to-classify information in order to form the maximum separation, a method of analysis of data features was developed. The method allows in the hyperspace of features to ensure the formation of grouping of data with minimal loss of information. This allows for a local offset of the data subgroup to improve separation. Spatial displacement takes place in the data separation zone and is local in nature. This ensures that the general data sets are not shifted in space, which does not change the informativeness of the main data segment. Within the set of local data of the separation zone, features are identified that are atypical or outlier relative to the group of research features and determine the delimitation of the data. The sets of features are determined on the basis of the formation of tuples of features by successive exclusion and establishing the level of influence of the data delimitation feature by their grouping. The determined level of impact allows identifying the most influential features and characterizing them as outlier, i.e. those features whose presence in the local boundary data of the demarcation zone has the greatest impact on the spatial grouping of data. The method allows determining the set of features by the level of influence and scope among the data. A method of parallel formation of features on local boundary data of the demarcation zone has been developed, which allows to study the influence of all features on small data with the selection of features sets of influence. All possible ways of maximizing the delimitation of local boundary data are determined, which are presented in the form of tree structures of tuples with the final search for the local maximum. The total number of trees of feature tuples is represented by a forest of feature tuples. As all pathways are explored, the branches of feature tuple trees are highlighted, which maximize the delimitation of local data, i.e. lead to finding a global maximum. Within these branches of tuples the most influential signs are defined. The practical importance of the research and the results obtained. The proposed methods of obtaining decisions with trust indicators and qualitative indicators have gained practical implementation, which allows obtaining many trust decisions, using an ensemble approach and getting the necessary discriminant differentiation of decisions by quality indicators. It has become possible to obtain sets of features for low-discharge data that determine the maximum possible delimitation and to establish a measure of features influence on the differentiance of data for the features of a particular target group. The results of the practical research permitted and the components of the trust concept with the projection on the software level of decision-making systems. The practical application of the developed methods of making decision-making systems allowed distinguishing a segment of data, the decisions on which are characterized by a high degree of trust and a segment of atypical data near the demarcation zone. At the same time, it was possible to obtain high quality of delimitation of compound data and methods of analysis of signs with the release of outliers. The developed methods can be applicable within a wide range of problems related to the sphere of intelligent information systems, as they allow obtaining high quality results. Of particular importance is the practical application of developed methods in intelligent information technologies for the areas of important and critical importance that require high-cost decisions. Spheres: security, socially significant, military, financial, which require critical decisions for society and the lives of people with the use of intelligent information technologies are those areas where intellectual information systems can be used.
Опис
Ключові слова
довіра до інтелектуальних інформаційних технологій, онтології довіри, структурний метод порівняння, аналіз ознак, ансамблі систем прийняття рішень, trust in intelligent information technologies, ontology of trust, structural method of alignment, ensemble of decision-making systems, analysis of features
Бібліографічний опис
Манзюк Є. А. Теоретичні та прикладні засади інтелектуальної інформаційної технології отримання довірчих рішень за людиноцентрованим підходом : дис. ... д-ра техн. наук : 05.13.06 / Є. А. Манзюк. - Хмельницький, 2022. - 453с.