Vizualizace rozhodovacích stromů

Název práce: Vizualizace rozhodovacích stromů
Autor(ka) práce: Svárovský, Matyáš
Typ práce: Diplomová práce
Vedoucí práce: Chudán, David
Oponenti práce: Helman, Karel
Jazyk práce: Česky
Abstrakt:
Práce se zabývá problematikou vizualizace při použití rozhodovacích stromů. Rozhodovací stromy jsou jednou z nejznámějších metod používaných v procesu dobývání znalostí během analytické fáze, označované jako data mining. Cílem práce je extenzivně shrnout možnosti zapojení vizualizace do rozhodovacích stromů a ověřit tyto možnosti na zvolených nástrojích dobývání znalostí na trhu. Toho je dosaženo popsáním hlavních principů a vizualizačních technik na základě studia odborné literatury, dále sestavením srovnávacích kritérií z teoretického základu, rešerší dostupných softwarových nástrojů na trhu a jejich následným porovnáním dle stanovených kritérií. Vyzkoušeno je celkem deset populárních nástrojů z oblasti dobývání znalostí. Všechny nástroje vhodným způsobem reprezentují základní informace v modelu rozhodovacího stromu. Liší se ale podstatnými rozdíly v pokročilejších funkcích, některé důležité zobrazovací techniky nebývají implementovány vůbec. Interaktivní zapojení uživatele do celého procesu není příliš běžné, často je naopak dávána přednost co největší automatizaci, hledání nejlepšího modelu a parametrů za pomoci počítačových algoritmů. Stále existuje prostor pro vylepšení funkcionalit takovým způsobem, aby uživatel lépe pochopil výsledný model i celkovou podstatu řešeného problému.
Klíčová slova: dobývání znalostí; porovnání nástrojů ; data mining; rozhodovací stromy; vizualizace
Název práce: Visualization of decision trees
Autor(ka) práce: Svárovský, Matyáš
Typ práce: Diploma thesis
Vedoucí práce: Chudán, David
Oponenti práce: Helman, Karel
Jazyk práce: Česky
Abstrakt:
Thesis deals with area of visualization while using decision trees. Decision trees are one of the most established methods used in the knowledge discovery process during the analytical phase known as data mining. The aim of this thesis is to summarize different options of implementing visualization with decision tree models and to verify these options in selected data mining tools available on the market. The aim is achieved by describing the main principles and visualization techniques based on literature study, preparing comparative criteria from this theoretical basis, research of available software tools and then comparing them using specified metrics. Ten total data mining tools have been tested. Almost all these tools are able to represent basic information in the decision tree model. However, they differ vastly in more advanced functions and sometimes important visualization techniques are not implemented at all. Interactive involvement of the user is not very common, oftentimes automatization of the entire process is preferred. Automatization entails finding the best model and its parameters using computer algorithms. There is still room for improvement in functionalities in a way that the users can better understand the presented model and overall nature of the solved problem.
Klíčová slova: decision trees; visualization; knowledge discovery; data mining; tool comparison

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 7. 10. 2019
Datum podání práce: 3. 5. 2021
Datum obhajoby: 9. 6. 2021
Identifikátor v systému InSIS: https://insis.vse.cz/zp/71127/podrobnosti

Soubory ke stažení

    Poslední aktualizace: