Corporate Bankruptcy Prediction Using Bayesian Classifiers
Thesis title: | Využití Bayesovských sítí pro predikci korporátních bankrotů |
---|---|
Author: | Hátle, Lukáš |
Thesis type: | Diplomová práce |
Supervisor: | Witzany, Jiří |
Opponents: | Málek, Jiří |
Thesis language: | Česky |
Abstract: | Cílem práce je zhodnotit použití bayesovských klasifikátorů v predikci korporátních bankrotů. Získané výsledky naznačují, že bayesovské klasifikátory dosahují srovnatelných výsledků s častěji používanými metodami v této oblasti, jako jsou logistická regrese a rozhodovací stromy. Srovnání bylo provedeno na základě vlastní analýzy na datových souborech z České republiky a Polska. Celková úspěšnost naivních bayesovských klasifikátorů používajících entropickou diskretizaci s hybridním předvýběrem vysvětlujících atributů je pro český datový soubor 77,19 %, pro polský 79,63 %. Hodnoty AUC jsou pro příslušné datové soubory 0,81 a 0.87. Dosažené výsledky na polském datovém souboru byly porovnány s již publikovanými články od Tsaie (2009) a Wanga et al. (2014), které aplikují jiné klasifikační algoritmy na stejný datový soubor. Navrhované metody v této práci vycházejí ze srovnání velice úspěšně. Práce dále nabízí srovnání jednotlivých přístupů k diskretizaci numerických atributů a výběru relevantních vysvětlujících atributů. Tyto oblasti se ukazují pro zvýšení výkonnosti naivního bayesovského klasifikátoru jako klíčové. |
Keywords: | Naivní baysovský kalsifikátor; Výběr vysvětlujících atributů; Diskretizace numerických atributů; Predikce korporátních bankrotů; Bayesovská klasifikace |
Thesis title: | Corporate Bankruptcy Prediction Using Bayesian Classifiers |
---|---|
Author: | Hátle, Lukáš |
Thesis type: | Diploma thesis |
Supervisor: | Witzany, Jiří |
Opponents: | Málek, Jiří |
Thesis language: | Česky |
Abstract: | The aim of this study is to evaluate feasibility of using Bayes classifiers for predicting corporate bankruptcies. The results obtain show that Bayes classifiers do reach comparable results to then more commonly used methods such the logistic regression and the decision trees. The comparison has been carried out based on Czech and Polish data sets. The overall accuracy rate of these so called naive Bayes classifiers, using entropic discretization along with the hybrid pre-selection of the explanatory attributes, reaches 77.19 % for the Czech dataset and 79.76 % for the Polish set respectively. The AUC values for these data sets are 0.81 and 0.87. The results obtained for the Polish data set have been compared to the already published articles by Tsai (2009) and Wang et al. (2014) who applied different classification algorithms. The method proposed in my study, when compared to the above earlier works, comes out as quite successful. The thesis also includes comparing various approaches as regards the discretisation of numerical attributes and selecting the relevant explanatory attributes. These are the key issues for increasing performance of the naive Bayes classifiers |
Keywords: | Naive Bayes classifiers; Feature selection; Discretization of continuous variables; Bayes classification; Corporate bankruptcy prediction |
Information about study
Study programme: | Finance a účetnictví/Finanční inženýrství |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Finance and Accounting |
Department: | Department of Banking and Insurance |
Information on submission and defense
Date of assignment: | 8. 4. 2014 |
---|---|
Date of submission: | 31. 8. 2014 |
Date of defense: | 5. 12. 2014 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/47525/podrobnosti |