Aplikace strojového učení pro predikci odchodu zákazníků
Název práce: | Aplikace strojového učení pro predikci odchodu zákazníků |
---|---|
Autor(ka) práce: | Hýbl, Jan |
Typ práce: | Diplomová práce |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Palán, Luděk |
Jazyk práce: | Česky |
Abstrakt: | Tato diplomová práce se zabývá aplikací strojového učení pro získání co nejkvalitnějšího modelu pro binární klasifikaci vytvořeného na datech o odchodech klientů z banky. První kapitola je věnována strojovému učení obecně a představení kroků nezbytných při jeho praktické aplikaci. V rámci kapitoly druhé je vysvětlen princip fungování rozhodovacích stromů, na což v kapitole třetí navazuje představení na nich postavených ensemble modelů. V praktické části jsou poté analyzovány dva vybrané datasety, díky nimž je znázorněno, že zatímco samostatný rozhodovací strom je oproti ensemble modelům z pohledu predikčních schopností značně slabý, vybrat konkrétního vítěze nelze, jelikož výkonnost zvolených ensemble modelů je velmi podobná. Po zahrnutí vlivu výpočetní náročnosti se tak jako nejatraktivnější jeví XGBClassifier. Zajímavým zjištěním ohledně optimalizace hyperparametrů je, že ve většině případů stačí pro dosažení téměř maximálních možných kvalit modelu vyzkoušet pouze několik málo náhodně vybraných kombinací jejich hodnot. Na závěr je s ohledem na relativně nízkou recall představena nutnost vhodné volby threshold hodnoty pro predikci. |
Klíčová slova: | klasifikace; optimalizace hyperparametrů; AUC; precision; recall; strojové učení; Python |
Název práce: | Application of machine learning for customer churn prediction |
---|---|
Autor(ka) práce: | Hýbl, Jan |
Typ práce: | Diploma thesis |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Palán, Luděk |
Jazyk práce: | Česky |
Abstrakt: | This master thesis deals with the application of machine learning to obtain a model with the best possible predictive power for a binary classification using data about bank customer churn. The first chapter is devoted to machine learning in general and presenting the steps necessary in its practical application. In the second chapter, the principles of decision trees are explained, which is followed by the presentation of with them associated ensemble learning models. In the practical part, two selected datasets are then analyzed, which shows that while a simple decision tree is considerably weak compared to ensemble models from the perspective of predictive capabilities, the predictive powers of the selected ensemble models are very similar. After comparing also the computational complexity, XGBClassifier seems to be the most attractive algorithm. An interesting finding regarding the optimization of hyperparameters is that in most cases it is sufficient to try only a few randomly selected combinations of their values to achieve the almost maximum possible model quality. Finally, with regard to the relatively low recall, the need for an appropriate choice of threshold value for the prediction is presented. |
Klíčová slova: | AUC; hyperparameter tuning; precision; machine learning; classification; recall; Python |
Informace o studiu
Studijní program / obor: | Finanční inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta financí a účetnictví |
Katedra: | Katedra bankovnictví a pojišťovnictví |
Informace o odevzdání a obhajobě
Datum zadání práce: | 30. 11. 2023 |
---|---|
Datum podání práce: | 21. 5. 2024 |
Datum obhajoby: | 13. 6. 2024 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/86944/podrobnosti |