Automation of a data mining process in the road accidents data from London by the LISp-Miner system

Thesis title: Automatizace dataminingového procesu v datech o dopravních nehodách v Londýně
Author: Soukup, Tomáš
Thesis type: Diplomová práce
Supervisor: Rauch, Jan
Opponents: Vojíř, Stanislav
Thesis language: Česky
Abstract:
Tématem práce je oblast automatizovaného data miningu a kroky spojené s řešením analytických otázek pomocí systému LISp-Miner v datech se záznamy o dopravních nehodách. Analytické otázky byly vytvářeny na základě doménových znalostí získaných ze statistik dopravních nehod ve Velké Británii a z předchozí analýzy provedené během mé semestrální práce. Hlavním cílem je vytvořit návrh automatizovaného procesu, který provede analýzu vstupních dat použitím procedur 4ft-Miner, Ac4ft-Miner a SD4ft-Miner, a jeho prostřednictvím vyhledat nové znalosti pro každý rok sledovaného období. Jazykem implementace je LMCL, který umožňuje použití funkcionality systému LISp-Miner automatizovaným způsobem. Vytvořené skripty je možné použít pro analýzu dat se stejnou strukturou, anebo po jejich manuální úpravě pro data zcela odlišná.
Keywords: CRISP-DM; LISp-Miner; LMCL; Automatizovaný data mining
Thesis title: Automation of a data mining process in the road accidents data from London by the LISp-Miner system
Author: Soukup, Tomáš
Thesis type: Diploma thesis
Supervisor: Rauch, Jan
Opponents: Vojíř, Stanislav
Thesis language: Česky
Abstract:
This thesis is focused on the area of automated data mining and to describe steps associated with solving analytical questions using the LISp-Miner system in the data with road accident records. Analytical tasks were primarily created based on domene knowledge from road accidents statistics in Great Britain and from previous analysis in my semestral project. The aim of this thesis is creation of an automated data mining process for analyze the input data by applying 4ft-Miner, Ac4ft-Miner a SD4ft-Miner procedures, and looking for a new knowledge for every single year of the analyzed period. The implementation language is the LMCL language that enables usage of the LISp-Miner system's functionality in an automated way. These created scripts could be used for analyses of another dataset with the same structure or with some manual changes in initial parameters for the quite different data.
Keywords: Automated data mining; CRISP-DM; LISp-Miner; LMCL

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 19. 5. 2015
Date of submission: 3. 12. 2015
Date of defense: 3. 2. 2016
Identifier in the InSIS system: https://insis.vse.cz/zp/53086/podrobnosti

Files for download

    Last update: