Visualization of decision trees

Thesis title: Vizualizace rozhodovacích stromů
Author: Svárovský, Matyáš
Thesis type: Diplomová práce
Supervisor: Chudán, David
Opponents: Helman, Karel
Thesis language: Česky
Abstract:
Práce se zabývá problematikou vizualizace při použití rozhodovacích stromů. Rozhodovací stromy jsou jednou z nejznámějších metod používaných v procesu dobývání znalostí během analytické fáze, označované jako data mining. Cílem práce je extenzivně shrnout možnosti zapojení vizualizace do rozhodovacích stromů a ověřit tyto možnosti na zvolených nástrojích dobývání znalostí na trhu. Toho je dosaženo popsáním hlavních principů a vizualizačních technik na základě studia odborné literatury, dále sestavením srovnávacích kritérií z teoretického základu, rešerší dostupných softwarových nástrojů na trhu a jejich následným porovnáním dle stanovených kritérií. Vyzkoušeno je celkem deset populárních nástrojů z oblasti dobývání znalostí. Všechny nástroje vhodným způsobem reprezentují základní informace v modelu rozhodovacího stromu. Liší se ale podstatnými rozdíly v pokročilejších funkcích, některé důležité zobrazovací techniky nebývají implementovány vůbec. Interaktivní zapojení uživatele do celého procesu není příliš běžné, často je naopak dávána přednost co největší automatizaci, hledání nejlepšího modelu a parametrů za pomoci počítačových algoritmů. Stále existuje prostor pro vylepšení funkcionalit takovým způsobem, aby uživatel lépe pochopil výsledný model i celkovou podstatu řešeného problému.
Keywords: dobývání znalostí; porovnání nástrojů ; data mining; rozhodovací stromy; vizualizace
Thesis title: Visualization of decision trees
Author: Svárovský, Matyáš
Thesis type: Diploma thesis
Supervisor: Chudán, David
Opponents: Helman, Karel
Thesis language: Česky
Abstract:
Thesis deals with area of visualization while using decision trees. Decision trees are one of the most established methods used in the knowledge discovery process during the analytical phase known as data mining. The aim of this thesis is to summarize different options of implementing visualization with decision tree models and to verify these options in selected data mining tools available on the market. The aim is achieved by describing the main principles and visualization techniques based on literature study, preparing comparative criteria from this theoretical basis, research of available software tools and then comparing them using specified metrics. Ten total data mining tools have been tested. Almost all these tools are able to represent basic information in the decision tree model. However, they differ vastly in more advanced functions and sometimes important visualization techniques are not implemented at all. Interactive involvement of the user is not very common, oftentimes automatization of the entire process is preferred. Automatization entails finding the best model and its parameters using computer algorithms. There is still room for improvement in functionalities in a way that the users can better understand the presented model and overall nature of the solved problem.
Keywords: decision trees; visualization; knowledge discovery; data mining; tool comparison

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 7. 10. 2019
Date of submission: 3. 5. 2021
Date of defense: 9. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/71127/podrobnosti

Files for download

    Last update: