Využití metod data miningu při analýze kreditních dat
Název práce: | Využití metod data miningu při analýze kreditních dat |
---|---|
Autor(ka) práce: | Tvaroh, Tomáš |
Typ práce: | Diplomová práce |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Matejašák, Milan |
Jazyk práce: | Česky |
Abstrakt: | Tato práce se zabývá porovnáním vybraných metod data miningu pro řešení klasifikačních úloh s metodou klasifikace pomocí logistické regrese. V první části práce je krátce představen data mining jako vědní disciplína a úloha klasifikace je uvedena do kontextu procesu vytěžování dat. V další části je vysvětlen princip fungování jednotlivých metod, mezi které byli, společně s logistickou regresí, vybrány umělé neuronové sítě, klasifikační rozhodovací stromy a metoda SVM. Společně s matematickou podstatou algoritmů je vždy uveden i způsob, jakým u hotového modelu probíhá klasifikace nových příkladů. V praktické části diplomové práce jsou popsané metody otestovány na reálných datech společnosti Lending Club a jsou srovnány z hlediska přesnosti klasifikace. Na závěr je zhodnoceno, zda je výsadní postavení logistické regrese dané historicky nebo zda si ho metoda skutečně zaslouží díky vysoké klasifikační síle v porovnání s ostatními metodami. |
Klíčová slova: | neuronové sítě; logistická regrese; klasifikace; data mining; rozhodovací stromy; SVM |
Název práce: | Using data mining methods in the analysis of credit risk data |
---|---|
Autor(ka) práce: | Tvaroh, Tomáš |
Typ práce: | Diploma thesis |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Matejašák, Milan |
Jazyk práce: | Česky |
Abstrakt: | This thesis focuses on comparison of selected data mining methods for solving classification tasks with the method of logistic regression. First part of the thesis briefly introduces data mining as a scientific discipline and classification task is shown in the context of knowledge data discovery. Next part explains the principle of particular methods amongst which, along with logistic regression, artificial neural networks, classification decision trees and Support Vector Machine method were selected. Together with mathematical background of each algorithm, demonstration of how the classification functions for new examples is mentioned. Analytical part of this thesis tests decribed methods on real-world data from the Lending Club company and they are compared based on classification accuracy. Towards the end, an evaluation of logistic regression is made in terms of whether its majority position is due to historical reasons or for its high classification accuracy compared to other methods. |
Klíčová slova: | decision trees; SVM; neural networks; logistic regression; classification; data mining |
Informace o studiu
Studijní program / obor: | Finance a účetnictví/Finanční inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta financí a účetnictví |
Katedra: | Katedra bankovnictví a pojišťovnictví |
Informace o odevzdání a obhajobě
Datum zadání práce: | 11. 10. 2013 |
---|---|
Datum podání práce: | 15. 12. 2013 |
Datum obhajoby: | 22. 1. 2014 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/44777/podrobnosti |