Porovnání vybraných klasifikačních metod na základě reálných datových souborů
Název práce: | Porovnání vybraných klasifikačních metod na základě reálných datových souborů |
---|---|
Autor(ka) práce: | Cujba, Maria |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Šulc, Zdeněk |
Oponenti práce: | Řezanková, Hana |
Jazyk práce: | Česky |
Abstrakt: | Tato bakalářská práce se zabývá porovnáním vybraných klasifikačních metod na základě reálných datových souborů. Cílem práce je zhodnotit výkonnost vybraných klasifikačních metod: logistická regrese, rozhodovací strom, náhodný les a metoda podpůrných vektorů. V teoretické části práce jsou představeny použité metody a techniky sloužící k jejich vyhodnocení. V praktické části je pracováno s pěti reálnými datovými soubory. Tato část obsahuje popis datových souborů, provedení explorační datové analýzy, výběr relevantních proměnných a tvorbu a evaluaci modelů. Na závěr jsou výsledky interpretovány s ohledem na různé metriky výkonnosti a je diskutována vhodnost použití jednotlivých metod v konkrétních situacích. |
Klíčová slova: | strojové učení; Python; Klasifikační metody; analýza reálných dat |
Název práce: | Comparison of selected classification methods based on real datasets |
---|---|
Autor(ka) práce: | Cujba, Maria |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Šulc, Zdeněk |
Oponenti práce: | Řezanková, Hana |
Jazyk práce: | Česky |
Abstrakt: | This bachelor thesis deals with the comparison of selected classification methods based on real datasets. The aim of the thesis is to evaluate the performance of the selected classification methods: logistic regression, decision tree, random forest and support vector machine. The theoretical part of the thesis presents the methods and the techniques used to evaluate the models. In the practical part, five real datasets are worked with. This part includes the description of the datasets, performing exploratory data analysis, selecting relevant variables and building and evaluating the models. Finally, the results are interpreted with respect to different performance metrics and the appropriateness of using each method in specific situations is discussed. |
Klíčová slova: | Classification methods; machine learning; Python; real data analysis |
Informace o studiu
Studijní program / obor: | Matematické metody v ekonomii/Datové analýzy a modelování |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 13. 11. 2023 |
---|---|
Datum podání práce: | 27. 6. 2024 |
Datum obhajoby: | 19. 8. 2024 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/86516/podrobnosti |