Comparison of selected classification methods based on real datasets

Thesis title: Porovnání vybraných klasifikačních metod na základě reálných datových souborů
Author: Cujba, Maria
Thesis type: Bakalářská práce
Supervisor: Šulc, Zdeněk
Opponents: Řezanková, Hana
Thesis language: Česky
Abstract:
Tato bakalářská práce se zabývá porovnáním vybraných klasifikačních metod na základě reálných datových souborů. Cílem práce je zhodnotit výkonnost vybraných klasifikačních metod: logistická regrese, rozhodovací strom, náhodný les a metoda podpůrných vektorů. V teoretické části práce jsou představeny použité metody a techniky sloužící k jejich vyhodnocení. V praktické části je pracováno s pěti reálnými datovými soubory. Tato část obsahuje popis datových souborů, provedení explorační datové analýzy, výběr relevantních proměnných a tvorbu a evaluaci modelů. Na závěr jsou výsledky interpretovány s ohledem na různé metriky výkonnosti a je diskutována vhodnost použití jednotlivých metod v konkrétních situacích.
Keywords: strojové učení; Python; Klasifikační metody; analýza reálných dat
Thesis title: Comparison of selected classification methods based on real datasets
Author: Cujba, Maria
Thesis type: Bachelor thesis
Supervisor: Šulc, Zdeněk
Opponents: Řezanková, Hana
Thesis language: Česky
Abstract:
This bachelor thesis deals with the comparison of selected classification methods based on real datasets. The aim of the thesis is to evaluate the performance of the selected classification methods: logistic regression, decision tree, random forest and support vector machine. The theoretical part of the thesis presents the methods and the techniques used to evaluate the models. In the practical part, five real datasets are worked with. This part includes the description of the datasets, performing exploratory data analysis, selecting relevant variables and building and evaluating the models. Finally, the results are interpreted with respect to different performance metrics and the appropriateness of using each method in specific situations is discussed.
Keywords: Classification methods; machine learning; Python; real data analysis

Information about study

Study programme: Matematické metody v ekonomii/Datové analýzy a modelování
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 13. 11. 2023
Date of submission: 27. 6. 2024
Date of defense: 2024

Files for download

The files will be available after the defense of the thesis.

    Last update: