Porovnání vybraných klasifikačních metod na základě reálných datových souborů
Autor(ka) práce:
Cujba, Maria
Typ práce:
Bakalářská práce
Vedoucí práce:
Šulc, Zdeněk
Oponenti práce:
Řezanková, Hana
Jazyk práce:
Česky
Abstrakt:
Tato bakalářská práce se zabývá porovnáním vybraných klasifikačních metod na základě reálných datových souborů. Cílem práce je zhodnotit výkonnost vybraných klasifikačních metod: logistická regrese, rozhodovací strom, náhodný les a metoda podpůrných vektorů. V teoretické části práce jsou představeny použité metody a techniky sloužící k jejich vyhodnocení. V praktické části je pracováno s pěti reálnými datovými soubory. Tato část obsahuje popis datových souborů, provedení explorační datové analýzy, výběr relevantních proměnných a tvorbu a evaluaci modelů. Na závěr jsou výsledky interpretovány s ohledem na různé metriky výkonnosti a je diskutována vhodnost použití jednotlivých metod v konkrétních situacích.
Klíčová slova:
strojové učení; Python; Klasifikační metody; analýza reálných dat
Název práce:
Comparison of selected classification methods based on real datasets
Autor(ka) práce:
Cujba, Maria
Typ práce:
Bachelor thesis
Vedoucí práce:
Šulc, Zdeněk
Oponenti práce:
Řezanková, Hana
Jazyk práce:
Česky
Abstrakt:
This bachelor thesis deals with the comparison of selected classification methods based on real datasets. The aim of the thesis is to evaluate the performance of the selected classification methods: logistic regression, decision tree, random forest and support vector machine. The theoretical part of the thesis presents the methods and the techniques used to evaluate the models. In the practical part, five real datasets are worked with. This part includes the description of the datasets, performing exploratory data analysis, selecting relevant variables and building and evaluating the models. Finally, the results are interpreted with respect to different performance metrics and the appropriateness of using each method in specific situations is discussed.
Klíčová slova:
Classification methods; machine learning; Python; real data analysis
Informace o studiu
Studijní program / obor:
Matematické metody v ekonomii/Datové analýzy a modelování