Automation of a data mining process in the data about traffic accidents in the Czech Republic
Thesis title: | Automatizace dataminingového procesu v datech o dopravních nehodách v České republice |
---|---|
Author: | Podavka, Jan |
Thesis type: | Diplomová práce |
Supervisor: | Šimůnek, Milan |
Opponents: | Urbaniec, Krzysztof |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá tématem automatizace dataminingového procesu v programu LISp-Miner. Cílem práce je vytvořit automatizovaný proces, který analyzuje analytické otázky v datech o dopravních nehodách v České republice pomocí skriptovacího jazyka LMCL a modulu LM Exec. Práce v teoretické části popisuje celý proces dobývání znalostí z databází a nejpoužívanější metodiky. Dále popisuje relevantní témata pro práci s programem LISp-Miner. Praktická část je zaměřena na popis dopravních nehod v ČR, popis použitých dat, tvorbu a vyhodnocení analytických otázek a především popis vytvořených skriptů. Výstupem práce je skupina skriptů a návod, jak je znovu použít, takže je možné je znovu využít pro analýzu aktuálních dat o dopravních nehodách nejenom v ČR, pokud budou mít data stejnou strukturu. |
Keywords: | LMCL; LISp-Miner, LMCL, LM Exec; CRISP-DM; Automatizace datamingového procesu; LM Exec |
Thesis title: | Automation of a data mining process in the data about traffic accidents in the Czech Republic |
---|---|
Author: | Podavka, Jan |
Thesis type: | Diploma thesis |
Supervisor: | Šimůnek, Milan |
Opponents: | Urbaniec, Krzysztof |
Thesis language: | Česky |
Abstract: | This master thesis deals with automation process of a data mining in the LISp-Miner program. The aim of this thesis is to create an automated process that analyzes analytical questions in the data about traffic accidents in the Czech Republic using a LMCL scripting language and LM Exec module. Theoretical part of thesis describes the process of knowledge discovery in databases and most widely used methodology. It also describes the relevant topics for the work with LISp-Miner. The practical part is focused on description of traffic accidents in the Czech Republic, a description of the used data, creation and evaluation of analytical questions and especially a description of created scripts. The output of the thesis is a group of scripts and manual how to use them again, so they can be reused for analysis of actual data on traffic accidents not only in the Czech Republic, if they have the same data structure. |
Keywords: | LMCL; LISp-Miner,; CRISP-DM; Automation of a data mining process; LM Exec |
Information about study
Study programme: | Aplikovaná informatika/Znalostní a webové technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 4. 5. 2016 |
---|---|
Date of submission: | 1. 5. 2017 |
Date of defense: | 5. 6. 2017 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/57563/podrobnosti |