Comparison of Methods for the Analysis of Categorical Data with Easy Interpretation
Thesis title: | Porovnání metod pro analýzu kategoriální data se snadnou interpretací |
---|---|
Author: | Panuška, Roman |
Thesis type: | Diplomová práce |
Supervisor: | Máša, Petr |
Opponents: | Sýkora, Lukáš |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá představením metod vhodných pro analýzu kategoriálních dat se snadnou interpretací. Primární úlohou je tyto metody identifikovat, představit a následně je otestovat na vhodném datasetu s kategoriálními daty. Práce začíná úvodem do problematiky kategoriálních dat a vysvětlením konceptu explainable AI (XAI) neboli vysvětlitelné umělé inteligence. Následně jsou představeny jednotlivé metody pro analýzu kategoriálních dat se snadnou interpretací, které mohou být také jednoduše integrovány do konceptu XAI, jelikož je jejich rozhodovací proces snadno interpretovatelný. Je zde vhodně shrnut jejich teoretický základ, který má za cíl čtenářovi poskytnout srozumitelný a strukturovaný přehled s popisem jednotlivých metod a přístupů. Druhá část této diplomové práce je praktická a jednotlivé metody jsou otestovány na datasetu s kategoriálními daty. Tato praktická část je zpracována v programovacím jazyce Python za pomoci statistických knihoven a knihoven strojového učení, a může čtenářovi sloužit i jako manuál pro aplikaci metod pro analýzu kategoriálních dat a intepretaci jejich výsledků. V závěrečné části diplomové práce jsou shrnuty klíčové poznatky a doporučení pro využití metod v praxi. Práce poskytuje čtenářům vodítko pro výběr vhodných metod analýzy kategoriálních dat v závislosti na konkrétních úlohách a požadavcích a přispívá k lepšímu porozumění možností a omezení různých metod v oblasti XAI a jejich praktického významu pro analýzu kategoriálních dat. |
Keywords: | XAI; Python; Analýza kategoriálních dat |
Thesis title: | Comparison of Methods for the Analysis of Categorical Data with Easy Interpretation |
---|---|
Author: | Panuška, Roman |
Thesis type: | Diploma thesis |
Supervisor: | Máša, Petr |
Opponents: | Sýkora, Lukáš |
Thesis language: | Česky |
Abstract: | This diploma thesis focuses on introducing suitable methods for analyzing categorical data with easy interpretation. The primary task is to identify, present, and subsequently test these methods on a suitable dataset with categorical data. The work begins with an introduction to the issue of categorical data and an explanation of the concept of explainable AI (XAI). Individual methods for analyzing categorical data with easy interpretation, which can also be easily integrated into the XAI concept due to their decision-making process being easily interpretable, are then presented. Their theoretical basis is adequately summarized, aiming to provide the reader with a comprehensible and structured overview, complete with descriptions of individual methods and approaches. The second part of this thesis is practical, testing individual methods on a dataset with categorical data. The practical part is processed in the Python programming language with the help of statistical and machine learning libraries, and it can also serve as a manual for the reader for applying methods for analyzing categorical data and interpreting their results. In the final part of the thesis, key findings and recommendations for the practical use of methods are summarized. The work provides readers with guidance for selecting the most suitable method of categorical data analysis, depending on specific tasks and requirements, and contributes to a better understanding of the possibilities and limitations of various methods in the field of XAI and their practical significance for the analysis of categorical data. |
Keywords: | XAI; Python; Categorical data analysis |
Information about study
Study programme: | Znalostní a webové technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 8. 3. 2023 |
---|---|
Date of submission: | 29. 6. 2023 |
Date of defense: | 6. 9. 2023 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/82719/podrobnosti |