Comparison of selected classification methods based on real datasets
Thesis title: | Porovnání vybraných klasifikačních metod na základě reálných datových souborů |
---|---|
Author: | Cujba, Maria |
Thesis type: | Bakalářská práce |
Supervisor: | Šulc, Zdeněk |
Opponents: | Řezanková, Hana |
Thesis language: | Česky |
Abstract: | Tato bakalářská práce se zabývá porovnáním vybraných klasifikačních metod na základě reálných datových souborů. Cílem práce je zhodnotit výkonnost vybraných klasifikačních metod: logistická regrese, rozhodovací strom, náhodný les a metoda podpůrných vektorů. V teoretické části práce jsou představeny použité metody a techniky sloužící k jejich vyhodnocení. V praktické části je pracováno s pěti reálnými datovými soubory. Tato část obsahuje popis datových souborů, provedení explorační datové analýzy, výběr relevantních proměnných a tvorbu a evaluaci modelů. Na závěr jsou výsledky interpretovány s ohledem na různé metriky výkonnosti a je diskutována vhodnost použití jednotlivých metod v konkrétních situacích. |
Keywords: | strojové učení; Python; Klasifikační metody; analýza reálných dat |
Thesis title: | Comparison of selected classification methods based on real datasets |
---|---|
Author: | Cujba, Maria |
Thesis type: | Bachelor thesis |
Supervisor: | Šulc, Zdeněk |
Opponents: | Řezanková, Hana |
Thesis language: | Česky |
Abstract: | This bachelor thesis deals with the comparison of selected classification methods based on real datasets. The aim of the thesis is to evaluate the performance of the selected classification methods: logistic regression, decision tree, random forest and support vector machine. The theoretical part of the thesis presents the methods and the techniques used to evaluate the models. In the practical part, five real datasets are worked with. This part includes the description of the datasets, performing exploratory data analysis, selecting relevant variables and building and evaluating the models. Finally, the results are interpreted with respect to different performance metrics and the appropriateness of using each method in specific situations is discussed. |
Keywords: | Classification methods; machine learning; Python; real data analysis |
Information about study
Study programme: | Matematické metody v ekonomii/Datové analýzy a modelování |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Statistics and Probability |
Information on submission and defense
Date of assignment: | 13. 11. 2023 |
---|---|
Date of submission: | 27. 6. 2024 |
Date of defense: | 19. 8. 2024 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/86516/podrobnosti |