Vizualizace rozhodovacích stromů
Název práce: | Vizualizace rozhodovacích stromů |
---|---|
Autor(ka) práce: | Svárovský, Matyáš |
Typ práce: | Diplomová práce |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Helman, Karel |
Jazyk práce: | Česky |
Abstrakt: | Práce se zabývá problematikou vizualizace při použití rozhodovacích stromů. Rozhodovací stromy jsou jednou z nejznámějších metod používaných v procesu dobývání znalostí během analytické fáze, označované jako data mining. Cílem práce je extenzivně shrnout možnosti zapojení vizualizace do rozhodovacích stromů a ověřit tyto možnosti na zvolených nástrojích dobývání znalostí na trhu. Toho je dosaženo popsáním hlavních principů a vizualizačních technik na základě studia odborné literatury, dále sestavením srovnávacích kritérií z teoretického základu, rešerší dostupných softwarových nástrojů na trhu a jejich následným porovnáním dle stanovených kritérií. Vyzkoušeno je celkem deset populárních nástrojů z oblasti dobývání znalostí. Všechny nástroje vhodným způsobem reprezentují základní informace v modelu rozhodovacího stromu. Liší se ale podstatnými rozdíly v pokročilejších funkcích, některé důležité zobrazovací techniky nebývají implementovány vůbec. Interaktivní zapojení uživatele do celého procesu není příliš běžné, často je naopak dávána přednost co největší automatizaci, hledání nejlepšího modelu a parametrů za pomoci počítačových algoritmů. Stále existuje prostor pro vylepšení funkcionalit takovým způsobem, aby uživatel lépe pochopil výsledný model i celkovou podstatu řešeného problému. |
Klíčová slova: | dobývání znalostí; porovnání nástrojů ; data mining; rozhodovací stromy; vizualizace |
Název práce: | Visualization of decision trees |
---|---|
Autor(ka) práce: | Svárovský, Matyáš |
Typ práce: | Diploma thesis |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Helman, Karel |
Jazyk práce: | Česky |
Abstrakt: | Thesis deals with area of visualization while using decision trees. Decision trees are one of the most established methods used in the knowledge discovery process during the analytical phase known as data mining. The aim of this thesis is to summarize different options of implementing visualization with decision tree models and to verify these options in selected data mining tools available on the market. The aim is achieved by describing the main principles and visualization techniques based on literature study, preparing comparative criteria from this theoretical basis, research of available software tools and then comparing them using specified metrics. Ten total data mining tools have been tested. Almost all these tools are able to represent basic information in the decision tree model. However, they differ vastly in more advanced functions and sometimes important visualization techniques are not implemented at all. Interactive involvement of the user is not very common, oftentimes automatization of the entire process is preferred. Automatization entails finding the best model and its parameters using computer algorithms. There is still room for improvement in functionalities in a way that the users can better understand the presented model and overall nature of the solved problem. |
Klíčová slova: | decision trees; visualization; knowledge discovery; data mining; tool comparison |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 7. 10. 2019 |
---|---|
Datum podání práce: | 3. 5. 2021 |
Datum obhajoby: | 9. 6. 2021 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/71127/podrobnosti |