Analysis of Road Traffic Accidents Based on Czech Police Data
| Thesis title: | Analýza dopravní nehodovosti na datech Policie ČR |
|---|---|
| Author: | Soldát, Tomáš |
| Thesis type: | Bakalářská práce |
| Supervisor: | Chudán, David |
| Opponents: | Máša, Petr |
| Thesis language: | Česky |
| Abstract: | Tato bakalářská práce se zabývá analýzou dopravní nehodovosti v České republice prostřednictvím metod dobývání znalostí z databází. Motivací práce je společenská závažnost dopravních nehod a možnost využít rozsáhlý dataset vycházející z evidence Policie ČR za roky 2010 až 2025. Použitý dataset zachycuje přibližně 1,5 milionu nehod a 1,8 milionu zúčastněných řidičů. Teoretická část shrnuje metodiku CRISP-DM, asociační pravidla a přístup GUHA a podrobněji se věnuje procedurám 4ft-Miner a CF-Miner implementovaným v knihovně CleverMiner. Praktická část zahrnuje přípravu dat, explorační analýzu a čtyři modelovací úlohy. Dvě úlohy na úrovni nehody hledají kombinace okolností spojené se zraněním a s těžkými následky. Řidičská úloha se zaměřuje na charakteristiky řidiče a čtvrtá úloha využívá proceduru CF-Miner k popisu profilů kategorií závažnosti. Výstupem práce je sada interpretovaných pravidel zachycujících rizikové kombinace okolností dopravních nehod a zhodnocení toho, které typy atributů nesou ve vztahu k závažnosti následků nejsilnější signál. |
| Keywords: | CRISP-DM; GUHA; asociační pravidla; 4ft-Miner; CleverMiner; závažnost nehod; dobývání znalostí z databází; dopravní nehodovost |
| Thesis title: | Analysis of Road Traffic Accidents Based on Czech Police Data |
|---|---|
| Author: | Soldát, Tomáš |
| Thesis type: | Bachelor thesis |
| Supervisor: | Chudán, David |
| Opponents: | Máša, Petr |
| Thesis language: | Česky |
| Abstract: | of knowledge discovery in databases. The work is motivated by the societal importance of road accidents and the opportunity to make use of an extensive dataset drawn from the records of the Czech Police for the years 2010–2025. The dataset captures approximately 1.5 million accidents and 1.8 million participating drivers. The theoretical part summarises the CRISP-DM methodology, association rules and the GUHA approach, and provides a more detailed treatment of the 4ft-Miner and CF-Miner procedures implemented in the CleverMiner library. The practical part covers data preparation, exploratory analysis and four modelling tasks. Two accident-level tasks search for combinations of circumstances associated with injury and with severe consequences. The driver-level task focuses on driver characteristics, and the fourth task uses the CF-Miner procedure to describe profiles of accident severity categories. The output of the thesis is a set of interpreted rules capturing risk combinations of accident circumstances and an assessment of which types of attributes carry the strongest signal with respect to the severity of consequences. |
| Keywords: | accident severity; GUHA; road traffic accidents; knowledge discovery in databases; association rules; 4ft-Miner; CRISP-DM; CleverMiner |
Information about study
| Study programme: | Aplikovaná informatika |
|---|---|
| Type of study programme: | Bakalářský studijní program |
| Assigned degree: | Bc. |
| Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
| Faculty: | Faculty of Informatics and Statistics |
| Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
| Date of assignment: | 6. 10. 2025 |
|---|---|
| Date of submission: | 11. 5. 2026 |
| Date of defense: | 24. 6. 2026 |
| Identifier in the InSIS system: | https://insis.vse.cz/zp/93840/podrobnosti |