Analysis of crime convergence in the EU using machine learning methods
| Thesis title: | Analýza konvergence kriminality v EU metodami strojového učení |
|---|---|
| Author: | Kubíček, Max |
| Thesis type: | Bakalářská práce |
| Supervisor: | Berka, Petr |
| Opponents: | Máša, Petr |
| Thesis language: | Česky |
| Abstract: | Tato práce se zabývá vývojem kriminality v Evropské unii v období 2013–2023 se zaměřením na analýzu konvergence mezi členskými státy. Cílem práce je zhodnotit, zda dochází ke sbližování úrovně kriminality, a to s využitím kombinace tradičních statistických metod a metod strojového učení. Analýza vychází z dat Eurostatu o kriminalitě a ekonomických ukazatelích, konkrétně HDP na obyvatele. Pro hodnocení vývoje variability kriminality v čase je využita sigma- konvergence, zatímco shluková analýza (K-means) slouží k identifikaci skupin států s podobným profilem kriminality. Zkoumány jsou vybrané typy trestné činnosti, včetně úmyslných vražd, loupeží, vloupání do obydlí a drogové kriminality. Výsledky ukazují, že konvergence kriminality v Evropské unii není jednotná, ale liší se podle typu trestné činnosti. Zatímco u majetkové kriminality lze pozorovat trend sbližování mezi státy, drogová kriminalita zůstává výrazně heterogenní. U násilné kriminality je variabilita mezi státy nízká, což naznačuje, že k významné konvergenci došlo již v minulosti. Shluková analýza odhalila existenci relativně stabilních skupin států, které odpovídají širším socioekonomickým a geografickým vzorcům, zejména rozdílu mezi západní a východní Evropou. Výsledky naznačují, že konvergence probíhá spíše uvnitř těchto skupin než napříč celou Evropskou unií. Práce přispívá k pochopení vývoje kriminality v EU a ukazuje přínos kombinace statistických metod a metod strojového učení při analýze komplexních společenských jevů. Zároveň upozorňuje na význam institucionálních a socioekonomických faktorů při interpretaci mezinárodních srovnání kriminality. |
| Keywords: | Evropská unie; konvergence; sigma-konvergence; shluková analýza; kriminalita; strojové učení; K-means; Eurostat; časové řady; socioekonomické faktory |
| Thesis title: | Analysis of crime convergence in the EU using machine learning methods |
|---|---|
| Author: | Kubíček, Max |
| Thesis type: | Bachelor thesis |
| Supervisor: | Berka, Petr |
| Opponents: | Máša, Petr |
| Thesis language: | Česky |
| Abstract: | This thesis examines the development of crime in the European Union during the period 2013–2023, with a focus on the analysis of convergence among member states. The main objective is to assess whether crime levels are converging across countries using a combination of traditional statistical methods and machine learning techniques. The analysis is based on Eurostat data on crime and economic indicators, specifically GDP per capita. Sigma convergence is applied to evaluate changes in the variability of crime over time, while cluster analysis (K-means) is used to identify groups of countries with similar crime profiles. The study focuses on selected types of criminal activity, including intentional homicide, robbery, burglary of private residential premises, and drug-related offences. The results indicate that crime convergence in the European Union is not uniform and varies by type of offence. While property crime shows a tendency toward convergence, drug- related crime remains highly heterogeneous. In the case of violent crime, variability between countries is low, suggesting that significant convergence may have already occurred in earlier periods. Cluster analysis reveals the existence of relatively stable groups of countries that correspond to broader socio-economic and geographical patterns, particularly the distinction between Western and Eastern Europe. The findings suggest that convergence occurs primarily within these groups rather than uniformly across the entire European Union. This thesis contributes to a better understanding of crime dynamics in the EU and demonstrates the value of combining statistical methods with machine learning techniques in the analysis of complex social phenomena. It also highlights the importance of institutional and socio-economic factors in the interpretation of cross-country comparisons of crime. |
| Keywords: | crime; European Union; convergence; sigma convergence; cluster analysis; machine learning; K-means; Eurostat; time series; socio-economic factors |
Information about study
| Study programme: | Aplikovaná informatika |
|---|---|
| Type of study programme: | Bakalářský studijní program |
| Assigned degree: | Bc. |
| Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
| Faculty: | Faculty of Informatics and Statistics |
| Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
| Date of assignment: | 29. 9. 2025 |
|---|---|
| Date of submission: | 7. 5. 2026 |
| Date of defense: | 19. 6. 2026 |
| Identifier in the InSIS system: | https://insis.vse.cz/zp/93649/podrobnosti |