Analysis of Road Traffic Accidents Based on Czech Police Data

Thesis title: Analýza dopravní nehodovosti na datech Policie ČR
Author: Soldát, Tomáš
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Máša, Petr
Thesis language: Česky
Abstract:
Tato bakalářská práce se zabývá analýzou dopravní nehodovosti v České republice prostřednictvím metod dobývání znalostí z databází. Motivací práce je společenská závažnost dopravních nehod a možnost využít rozsáhlý dataset vycházející z evidence Policie ČR za roky 2010 až 2025. Použitý dataset zachycuje přibližně 1,5 milionu nehod a 1,8 milionu zúčastněných řidičů. Teoretická část shrnuje metodiku CRISP-DM, asociační pravidla a přístup GUHA a podrobněji se věnuje procedurám 4ft-Miner a CF-Miner implementovaným v knihovně CleverMiner. Praktická část zahrnuje přípravu dat, explorační analýzu a čtyři modelovací úlohy. Dvě úlohy na úrovni nehody hledají kombinace okolností spojené se zraněním a s těžkými následky. Řidičská úloha se zaměřuje na charakteristiky řidiče a čtvrtá úloha využívá proceduru CF-Miner k popisu profilů kategorií závažnosti. Výstupem práce je sada interpretovaných pravidel zachycujících rizikové kombinace okolností dopravních nehod a zhodnocení toho, které typy atributů nesou ve vztahu k závažnosti následků nejsilnější signál.
Keywords: CRISP-DM; GUHA; asociační pravidla; 4ft-Miner; CleverMiner; závažnost nehod; dobývání znalostí z databází; dopravní nehodovost
Thesis title: Analysis of Road Traffic Accidents Based on Czech Police Data
Author: Soldát, Tomáš
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Máša, Petr
Thesis language: Česky
Abstract:
of knowledge discovery in databases. The work is motivated by the societal importance of road accidents and the opportunity to make use of an extensive dataset drawn from the records of the Czech Police for the years 2010–2025. The dataset captures approximately 1.5 million accidents and 1.8 million participating drivers. The theoretical part summarises the CRISP-DM methodology, association rules and the GUHA approach, and provides a more detailed treatment of the 4ft-Miner and CF-Miner procedures implemented in the CleverMiner library. The practical part covers data preparation, exploratory analysis and four modelling tasks. Two accident-level tasks search for combinations of circumstances associated with injury and with severe consequences. The driver-level task focuses on driver characteristics, and the fourth task uses the CF-Miner procedure to describe profiles of accident severity categories. The output of the thesis is a set of interpreted rules capturing risk combinations of accident circumstances and an assessment of which types of attributes carry the strongest signal with respect to the severity of consequences.
Keywords: accident severity; GUHA; road traffic accidents; knowledge discovery in databases; association rules; 4ft-Miner; CRISP-DM; CleverMiner

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 6. 10. 2025
Date of submission: 11. 5. 2026
Date of defense: 24. 6. 2026
Identifier in the InSIS system: https://insis.vse.cz/zp/93840/podrobnosti

Files for download

    Last update: