Comparison of Methods for the Analysis of Categorical Data with Easy Interpretation

Thesis title: Porovnání metod pro analýzu kategoriální data se snadnou interpretací
Author: Panuška, Roman
Thesis type: Diplomová práce
Supervisor: Máša, Petr
Opponents: Sýkora, Lukáš
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá představením metod vhodných pro analýzu kategoriálních dat se snadnou interpretací. Primární úlohou je tyto metody identifikovat, představit a následně je otestovat na vhodném datasetu s kategoriálními daty. Práce začíná úvodem do problematiky kategoriálních dat a vysvětlením konceptu explainable AI (XAI) neboli vysvětlitelné umělé inteligence. Následně jsou představeny jednotlivé metody pro analýzu kategoriálních dat se snadnou interpretací, které mohou být také jednoduše integrovány do konceptu XAI, jelikož je jejich rozhodovací proces snadno interpretovatelný. Je zde vhodně shrnut jejich teoretický základ, který má za cíl čtenářovi poskytnout srozumitelný a strukturovaný přehled s popisem jednotlivých metod a přístupů. Druhá část této diplomové práce je praktická a jednotlivé metody jsou otestovány na datasetu s kategoriálními daty. Tato praktická část je zpracována v programovacím jazyce Python za pomoci statistických knihoven a knihoven strojového učení, a může čtenářovi sloužit i jako manuál pro aplikaci metod pro analýzu kategoriálních dat a intepretaci jejich výsledků. V závěrečné části diplomové práce jsou shrnuty klíčové poznatky a doporučení pro využití metod v praxi. Práce poskytuje čtenářům vodítko pro výběr vhodných metod analýzy kategoriálních dat v závislosti na konkrétních úlohách a požadavcích a přispívá k lepšímu porozumění možností a omezení různých metod v oblasti XAI a jejich praktického významu pro analýzu kategoriálních dat.
Keywords: XAI; Python; Analýza kategoriálních dat
Thesis title: Comparison of Methods for the Analysis of Categorical Data with Easy Interpretation
Author: Panuška, Roman
Thesis type: Diploma thesis
Supervisor: Máša, Petr
Opponents: Sýkora, Lukáš
Thesis language: Česky
Abstract:
This diploma thesis focuses on introducing suitable methods for analyzing categorical data with easy interpretation. The primary task is to identify, present, and subsequently test these methods on a suitable dataset with categorical data. The work begins with an introduction to the issue of categorical data and an explanation of the concept of explainable AI (XAI). Individual methods for analyzing categorical data with easy interpretation, which can also be easily integrated into the XAI concept due to their decision-making process being easily interpretable, are then presented. Their theoretical basis is adequately summarized, aiming to provide the reader with a comprehensible and structured overview, complete with descriptions of individual methods and approaches. The second part of this thesis is practical, testing individual methods on a dataset with categorical data. The practical part is processed in the Python programming language with the help of statistical and machine learning libraries, and it can also serve as a manual for the reader for applying methods for analyzing categorical data and interpreting their results. In the final part of the thesis, key findings and recommendations for the practical use of methods are summarized. The work provides readers with guidance for selecting the most suitable method of categorical data analysis, depending on specific tasks and requirements, and contributes to a better understanding of the possibilities and limitations of various methods in the field of XAI and their practical significance for the analysis of categorical data.
Keywords: XAI; Python; Categorical data analysis

Information about study

Study programme: Znalostní a webové technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 8. 3. 2023
Date of submission: 29. 6. 2023
Date of defense: 6. 9. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/82719/podrobnosti

Files for download

    Last update: