Visualization of decision trees
Thesis title: | Vizualizace rozhodovacích stromů |
---|---|
Author: | Svárovský, Matyáš |
Thesis type: | Diplomová práce |
Supervisor: | Chudán, David |
Opponents: | Helman, Karel |
Thesis language: | Česky |
Abstract: | Práce se zabývá problematikou vizualizace při použití rozhodovacích stromů. Rozhodovací stromy jsou jednou z nejznámějších metod používaných v procesu dobývání znalostí během analytické fáze, označované jako data mining. Cílem práce je extenzivně shrnout možnosti zapojení vizualizace do rozhodovacích stromů a ověřit tyto možnosti na zvolených nástrojích dobývání znalostí na trhu. Toho je dosaženo popsáním hlavních principů a vizualizačních technik na základě studia odborné literatury, dále sestavením srovnávacích kritérií z teoretického základu, rešerší dostupných softwarových nástrojů na trhu a jejich následným porovnáním dle stanovených kritérií. Vyzkoušeno je celkem deset populárních nástrojů z oblasti dobývání znalostí. Všechny nástroje vhodným způsobem reprezentují základní informace v modelu rozhodovacího stromu. Liší se ale podstatnými rozdíly v pokročilejších funkcích, některé důležité zobrazovací techniky nebývají implementovány vůbec. Interaktivní zapojení uživatele do celého procesu není příliš běžné, často je naopak dávána přednost co největší automatizaci, hledání nejlepšího modelu a parametrů za pomoci počítačových algoritmů. Stále existuje prostor pro vylepšení funkcionalit takovým způsobem, aby uživatel lépe pochopil výsledný model i celkovou podstatu řešeného problému. |
Keywords: | dobývání znalostí; porovnání nástrojů ; data mining; rozhodovací stromy; vizualizace |
Thesis title: | Visualization of decision trees |
---|---|
Author: | Svárovský, Matyáš |
Thesis type: | Diploma thesis |
Supervisor: | Chudán, David |
Opponents: | Helman, Karel |
Thesis language: | Česky |
Abstract: | Thesis deals with area of visualization while using decision trees. Decision trees are one of the most established methods used in the knowledge discovery process during the analytical phase known as data mining. The aim of this thesis is to summarize different options of implementing visualization with decision tree models and to verify these options in selected data mining tools available on the market. The aim is achieved by describing the main principles and visualization techniques based on literature study, preparing comparative criteria from this theoretical basis, research of available software tools and then comparing them using specified metrics. Ten total data mining tools have been tested. Almost all these tools are able to represent basic information in the decision tree model. However, they differ vastly in more advanced functions and sometimes important visualization techniques are not implemented at all. Interactive involvement of the user is not very common, oftentimes automatization of the entire process is preferred. Automatization entails finding the best model and its parameters using computer algorithms. There is still room for improvement in functionalities in a way that the users can better understand the presented model and overall nature of the solved problem. |
Keywords: | decision trees; visualization; knowledge discovery; data mining; tool comparison |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 7. 10. 2019 |
---|---|
Date of submission: | 3. 5. 2021 |
Date of defense: | 9. 6. 2021 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/71127/podrobnosti |