Porovnání vybraných klasifikačních metod na základě reálných datových souborů

Název práce: Porovnání vybraných klasifikačních metod na základě reálných datových souborů
Autor(ka) práce: Cujba, Maria
Typ práce: Bakalářská práce
Vedoucí práce: Šulc, Zdeněk
Oponenti práce: Řezanková, Hana
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zabývá porovnáním vybraných klasifikačních metod na základě reálných datových souborů. Cílem práce je zhodnotit výkonnost vybraných klasifikačních metod: logistická regrese, rozhodovací strom, náhodný les a metoda podpůrných vektorů. V teoretické části práce jsou představeny použité metody a techniky sloužící k jejich vyhodnocení. V praktické části je pracováno s pěti reálnými datovými soubory. Tato část obsahuje popis datových souborů, provedení explorační datové analýzy, výběr relevantních proměnných a tvorbu a evaluaci modelů. Na závěr jsou výsledky interpretovány s ohledem na různé metriky výkonnosti a je diskutována vhodnost použití jednotlivých metod v konkrétních situacích.
Klíčová slova: strojové učení; Python; Klasifikační metody; analýza reálných dat
Název práce: Comparison of selected classification methods based on real datasets
Autor(ka) práce: Cujba, Maria
Typ práce: Bachelor thesis
Vedoucí práce: Šulc, Zdeněk
Oponenti práce: Řezanková, Hana
Jazyk práce: Česky
Abstrakt:
This bachelor thesis deals with the comparison of selected classification methods based on real datasets. The aim of the thesis is to evaluate the performance of the selected classification methods: logistic regression, decision tree, random forest and support vector machine. The theoretical part of the thesis presents the methods and the techniques used to evaluate the models. In the practical part, five real datasets are worked with. This part includes the description of the datasets, performing exploratory data analysis, selecting relevant variables and building and evaluating the models. Finally, the results are interpreted with respect to different performance metrics and the appropriateness of using each method in specific situations is discussed.
Klíčová slova: Classification methods; machine learning; Python; real data analysis

Informace o studiu

Studijní program / obor: Matematické metody v ekonomii/Datové analýzy a modelování
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 13. 11. 2023
Datum podání práce: 27. 6. 2024
Datum obhajoby: 2024

Soubory ke stažení

Soubory budou k dispozici až po obhajobě práce.

    Poslední aktualizace: