Hodnocení klienta pro poskytnutí úvěru

Název práce: Hodnocení klienta pro poskytnutí úvěru
Autor(ka) práce: Marushev, Vasilii
Typ práce: Bakalářská práce
Vedoucí práce: Koudelka, Jiří
Oponenti práce: Habarta, Filip
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zaměřuje na rozlišování mezi dobrými a špatnými klienty za účelem poskytnutí úvěru pomocí logistické regrese a následné hodnocení diskriminační schopnosti vytvořeného modelu. Praktický výzkum využívá reálná data spotřebitelských úvěrů poskytnutá bankou, která zveřejnila svá data v soutěži na platformě Kaggle. Analytická a modelovací fáze probíhají v programovacím jazyce Python. Výzkum prezentovaný v této práci přináší vzhledy ze statistického pohledu do problematiky hodnocení klientů pro poskytnutí úvěru. Před modelováním byly provedeny úpravy a transformace proměnných, které byly klíčové pro nezkreslení výsledků modelu. Důraz byl kladen na nastavení vah kvůli nevyváženosti datového souboru, což vedlo k lepší klasifikaci defaultních klientů. Provedená ROC analýza na trénovacích datech potvrdila akceptovatelnou diskriminační schopnost modelu, což se potvrdilo i na testovací množině dat. Křížová validace potvrdila výsledek dosažený na testovacích datech. Na konci byla provedena diskuze o analýze klasifikační tabulky, ve které byly prezentovány důležité poznatky o výkonnosti modelu. Metody a postupy aplikované v této práci mají potenciál být využity i pro hodnocení pravděpodobnosti defaultu (PD), což je klíčový aspekt pro regulace bankovního sektoru, jako jsou standardy Basel II.
Klíčová slova: Logistická regrese; ROC křivka; klasifikační tabulka; prahová hodnota
Název práce: Evaluation of the client for providing a loan
Autor(ka) práce: Marushev, Vasilii
Typ práce: Bachelor thesis
Vedoucí práce: Koudelka, Jiří
Oponenti práce: Habarta, Filip
Jazyk práce: Česky
Abstrakt:
This bachelor's thesis focuses on discriminating between good and bad clients for loan approval using logistic regression and then evaluating the discriminatory ability of the developed model. The practical research uses real consumer credit data from a bank that published their data in a competition on the Kaggle platform. The analytical and modeling phases are conducted in the Python programming language. The research presented in this paper provides insights from a statistical point of view into the problem of evaluating customers for credit. Before modeling, adjustments and transformations were made to the variables to avoid bias in the model results. Emphasis was placed on adjusting the weights due to an imbalance in the dataset, which led to better classification of default clients. The ROC analysis performed on the training data confirmed the acceptable discriminatory ability of the model, which was confirmed on the test dataset. Cross-validation confirmed the result obtained on the test data. Finally, a discussion of the classification table analysis was conducted, presenting important insights into the model's performance. The methods and procedures applied in this thesis can be used to evaluate the probability of default (PD), a key aspect of banking sector regulations such as Basel II standards.
Klíčová slova: Roc curve; threshold; confusion matrix; Logistic regression

Informace o studiu

Studijní program / obor: Matematické metody v ekonomii/Datové analýzy a modelování
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 4. 4. 2024
Datum podání práce: 5. 5. 2024
Datum obhajoby: 11. 6. 2024
Identifikátor v systému InSIS: https://insis.vse.cz/zp/88197/podrobnosti

Soubory ke stažení

    Poslední aktualizace: