Interpretace black-box prediktivních modelů zaměřená na kategoriální proměnné

Název práce: Interpretation of black-box predictive models focused on categorical variables
Autor(ka) práce: Matějka, Jonáš
Typ práce: Diploma thesis
Vedoucí práce: Máša, Petr
Oponenti práce: Sýkora, Lukáš
Jazyk práce: English
Abstrakt:
The thesis evaluates the usability of major methods for interpreting black-box predictive models on categorical variables to provide a comprehensive comparison. The main goal is methods summarisation, application on categorical datasets, usability evaluation and comparison. The first theoretical part introduces categorical variables and their challenges in machine learning (ML). Afterwards, the concept of explainable AI (XAI) and its relation to the interpretability of black-box ML models are discussed. Interpretability is further described to provide readers with the necessary background knowledge to comprehend the context in the practical part. Subsequently, major methods for ML interpretability are presented, and the theoretical part concludes by defining observation criteria for methods usability on categorical variables. The following practical part applies interpretability methods on two black-box predictive models, each trained on a different categorical dataset. The methods are implemented in the interactive Jupyter notebook environment using Python. The results of the methods are initially interpreted in detail and then summarised for the usability evaluation. Each method is assessed according to predefined criteria highlighting its key features for categorical variables. Furthermore, the strengths and weaknesses of the methods in terms of categorical variables are also analysed. The conclusion of the thesis summarises the key findings of the research and discusses the goal fulfilment, thesis limitations or further research. The outcome is the usability comparison of interpretability methods on categorical variables, including evaluating their strengths and weaknesses for these variables.
Klíčová slova: XAI; black-box; interpretable ML; Python; categorical variables
Název práce: Interpretace black-box prediktivních modelů zaměřená na kategoriální proměnné
Autor(ka) práce: Matějka, Jonáš
Typ práce: Diplomová práce
Vedoucí práce: Máša, Petr
Oponenti práce: Sýkora, Lukáš
Jazyk práce: English
Abstrakt:
Diplomová práce hodnotí použitelnost hlavních metod pro interpretabilitu predikčních modelů černé skříňky na kategoriálních proměnných, aby poskytla jejich komplexní srovnání. Hlavním cílem je shrnutí metod, jejich aplikace na kategoriálních souborech dat, vyhodnocení použitelnosti a porovnání. První teoretická část představuje kategoriální proměnné a jejich výzvy ve strojovém učení (ML). Poté je diskutován koncept vysvětlitelné umělé inteligence (XAI) a jeho vztah k interpretabilitě ML modelů typu černé skříňky. Interpretabilita je dále popsána tak, aby čtenáři poskytla potřebné základní znalosti pro pochopení souvislostí v praktické části. Následně jsou představeny hlavní metody interpretability ML a teoretická část je zakončena definováním pozorovacích kritérií pro použitelnost metod na kategoriálních proměnných. Následující praktická část aplikuje metody interpretability na dva prediktivní modely černé skříňky, z nichž každý je natrénován na jiném souboru kategoriálních dat. Metody jsou implementovány v interaktivním prostředí Jupyter notebook pomocí jazyka Python. Výsledky metod jsou nejprve podrobně interpretovány a poté shrnuty pro účely hodnocení použitelnosti. Každá metoda je hodnocena podle předem stanovených kritérií, která zdůrazňují její klíčové vlastnosti pro kategoriální proměnné. Dále jsou také analyzovány silné a slabé stránky metod z hlediska kategoriálních proměnných. Závěrečná část práce shrnuje klíčová zjištění výzkumu a pojednává o splnění cíle, omezení práce a možnostech dalšího výzkumu. Výsledkem je porovnání použitelnosti metod interpretability na kategoriálních proměnných a zhodnocení jejich silných a slabých stránek pro tyto proměnné.
Klíčová slova: black-box; interpretabilita ML; kategoriální proměnné; Python; XAI

Informace o studiu

Studijní program / obor: Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 17. 6. 2024
Datum podání práce: 1. 12. 2024
Datum obhajoby: 20. 1. 2025
Identifikátor v systému InSIS: https://insis.vse.cz/zp/88697/podrobnosti

Soubory ke stažení

    Poslední aktualizace: