Hodnocení klienta pro poskytnutí úvěru
Název práce: | Hodnocení klienta pro poskytnutí úvěru |
---|---|
Autor(ka) práce: | Marushev, Vasilii |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Koudelka, Jiří |
Oponenti práce: | Habarta, Filip |
Jazyk práce: | Česky |
Abstrakt: | Tato bakalářská práce se zaměřuje na rozlišování mezi dobrými a špatnými klienty za účelem poskytnutí úvěru pomocí logistické regrese a následné hodnocení diskriminační schopnosti vytvořeného modelu. Praktický výzkum využívá reálná data spotřebitelských úvěrů poskytnutá bankou, která zveřejnila svá data v soutěži na platformě Kaggle. Analytická a modelovací fáze probíhají v programovacím jazyce Python. Výzkum prezentovaný v této práci přináší vzhledy ze statistického pohledu do problematiky hodnocení klientů pro poskytnutí úvěru. Před modelováním byly provedeny úpravy a transformace proměnných, které byly klíčové pro nezkreslení výsledků modelu. Důraz byl kladen na nastavení vah kvůli nevyváženosti datového souboru, což vedlo k lepší klasifikaci defaultních klientů. Provedená ROC analýza na trénovacích datech potvrdila akceptovatelnou diskriminační schopnost modelu, což se potvrdilo i na testovací množině dat. Křížová validace potvrdila výsledek dosažený na testovacích datech. Na konci byla provedena diskuze o analýze klasifikační tabulky, ve které byly prezentovány důležité poznatky o výkonnosti modelu. Metody a postupy aplikované v této práci mají potenciál být využity i pro hodnocení pravděpodobnosti defaultu (PD), což je klíčový aspekt pro regulace bankovního sektoru, jako jsou standardy Basel II. |
Klíčová slova: | Logistická regrese; ROC křivka; klasifikační tabulka; prahová hodnota |
Název práce: | Evaluation of the client for providing a loan |
---|---|
Autor(ka) práce: | Marushev, Vasilii |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Koudelka, Jiří |
Oponenti práce: | Habarta, Filip |
Jazyk práce: | Česky |
Abstrakt: | This bachelor's thesis focuses on discriminating between good and bad clients for loan approval using logistic regression and then evaluating the discriminatory ability of the developed model. The practical research uses real consumer credit data from a bank that published their data in a competition on the Kaggle platform. The analytical and modeling phases are conducted in the Python programming language. The research presented in this paper provides insights from a statistical point of view into the problem of evaluating customers for credit. Before modeling, adjustments and transformations were made to the variables to avoid bias in the model results. Emphasis was placed on adjusting the weights due to an imbalance in the dataset, which led to better classification of default clients. The ROC analysis performed on the training data confirmed the acceptable discriminatory ability of the model, which was confirmed on the test dataset. Cross-validation confirmed the result obtained on the test data. Finally, a discussion of the classification table analysis was conducted, presenting important insights into the model's performance. The methods and procedures applied in this thesis can be used to evaluate the probability of default (PD), a key aspect of banking sector regulations such as Basel II standards. |
Klíčová slova: | Roc curve; threshold; confusion matrix; Logistic regression |
Informace o studiu
Studijní program / obor: | Matematické metody v ekonomii/Datové analýzy a modelování |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 4. 4. 2024 |
---|---|
Datum podání práce: | 5. 5. 2024 |
Datum obhajoby: | 11. 6. 2024 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/88197/podrobnosti |