Automation of a data mining process in the data about traffic accidents in the Czech Republic

Thesis title: Automatizace dataminingového procesu v datech o dopravních nehodách v České republice
Author: Podavka, Jan
Thesis type: Diplomová práce
Supervisor: Šimůnek, Milan
Opponents: Urbaniec, Krzysztof
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá tématem automatizace dataminingového procesu v programu LISp-Miner. Cílem práce je vytvořit automatizovaný proces, který analyzuje analytické otázky v datech o dopravních nehodách v České republice pomocí skriptovacího jazyka LMCL a modulu LM Exec. Práce v teoretické části popisuje celý proces dobývání znalostí z databází a nejpoužívanější metodiky. Dále popisuje relevantní témata pro práci s programem LISp-Miner. Praktická část je zaměřena na popis dopravních nehod v ČR, popis použitých dat, tvorbu a vyhodnocení analytických otázek a především popis vytvořených skriptů. Výstupem práce je skupina skriptů a návod, jak je znovu použít, takže je možné je znovu využít pro analýzu aktuálních dat o dopravních nehodách nejenom v ČR, pokud budou mít data stejnou strukturu.
Keywords: LMCL; LISp-Miner, LMCL, LM Exec; CRISP-DM; Automatizace datamingového procesu; LM Exec
Thesis title: Automation of a data mining process in the data about traffic accidents in the Czech Republic
Author: Podavka, Jan
Thesis type: Diploma thesis
Supervisor: Šimůnek, Milan
Opponents: Urbaniec, Krzysztof
Thesis language: Česky
Abstract:
This master thesis deals with automation process of a data mining in the LISp-Miner program. The aim of this thesis is to create an automated process that analyzes analytical questions in the data about traffic accidents in the Czech Republic using a LMCL scripting language and LM Exec module. Theoretical part of thesis describes the process of knowledge discovery in databases and most widely used methodology. It also describes the relevant topics for the work with LISp-Miner. The practical part is focused on description of traffic accidents in the Czech Republic, a description of the used data, creation and evaluation of analytical questions and especially a description of created scripts. The output of the thesis is a group of scripts and manual how to use them again, so they can be reused for analysis of actual data on traffic accidents not only in the Czech Republic, if they have the same data structure.
Keywords: LMCL; LISp-Miner,; CRISP-DM; Automation of a data mining process; LM Exec

Information about study

Study programme: Aplikovaná informatika/Znalostní a webové technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 4. 5. 2016
Date of submission: 1. 5. 2017
Date of defense: 5. 6. 2017
Identifier in the InSIS system: https://insis.vse.cz/zp/57563/podrobnosti

Files for download

    Last update: