Automation of a data mining process in the road accidents data from London by the LISp-Miner system
Thesis title: | Automatizace dataminingového procesu v datech o dopravních nehodách v Londýně |
---|---|
Author: | Soukup, Tomáš |
Thesis type: | Diplomová práce |
Supervisor: | Rauch, Jan |
Opponents: | Vojíř, Stanislav |
Thesis language: | Česky |
Abstract: | Tématem práce je oblast automatizovaného data miningu a kroky spojené s řešením analytických otázek pomocí systému LISp-Miner v datech se záznamy o dopravních nehodách. Analytické otázky byly vytvářeny na základě doménových znalostí získaných ze statistik dopravních nehod ve Velké Británii a z předchozí analýzy provedené během mé semestrální práce. Hlavním cílem je vytvořit návrh automatizovaného procesu, který provede analýzu vstupních dat použitím procedur 4ft-Miner, Ac4ft-Miner a SD4ft-Miner, a jeho prostřednictvím vyhledat nové znalosti pro každý rok sledovaného období. Jazykem implementace je LMCL, který umožňuje použití funkcionality systému LISp-Miner automatizovaným způsobem. Vytvořené skripty je možné použít pro analýzu dat se stejnou strukturou, anebo po jejich manuální úpravě pro data zcela odlišná. |
Keywords: | CRISP-DM; LISp-Miner; LMCL; Automatizovaný data mining |
Thesis title: | Automation of a data mining process in the road accidents data from London by the LISp-Miner system |
---|---|
Author: | Soukup, Tomáš |
Thesis type: | Diploma thesis |
Supervisor: | Rauch, Jan |
Opponents: | Vojíř, Stanislav |
Thesis language: | Česky |
Abstract: | This thesis is focused on the area of automated data mining and to describe steps associated with solving analytical questions using the LISp-Miner system in the data with road accident records. Analytical tasks were primarily created based on domene knowledge from road accidents statistics in Great Britain and from previous analysis in my semestral project. The aim of this thesis is creation of an automated data mining process for analyze the input data by applying 4ft-Miner, Ac4ft-Miner a SD4ft-Miner procedures, and looking for a new knowledge for every single year of the analyzed period. The implementation language is the LMCL language that enables usage of the LISp-Miner system's functionality in an automated way. These created scripts could be used for analyses of another dataset with the same structure or with some manual changes in initial parameters for the quite different data. |
Keywords: | Automated data mining; CRISP-DM; LISp-Miner; LMCL |
Information about study
Study programme: | Aplikovaná informatika/Znalostní technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 19. 5. 2015 |
---|---|
Date of submission: | 3. 12. 2015 |
Date of defense: | 3. 2. 2016 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/53086/podrobnosti |