Corporate Bankruptcy Prediction Using Bayesian Classifiers

Thesis title: Využití Bayesovských sítí pro predikci korporátních bankrotů
Author: Hátle, Lukáš
Thesis type: Diplomová práce
Supervisor: Witzany, Jiří
Opponents: Málek, Jiří
Thesis language: Česky
Abstract:
Cílem práce je zhodnotit použití bayesovských klasifikátorů v predikci korporátních bankrotů. Získané výsledky naznačují, že bayesovské klasifikátory dosahují srovnatelných výsledků s častěji používanými metodami v této oblasti, jako jsou logistická regrese a rozhodovací stromy. Srovnání bylo provedeno na základě vlastní analýzy na datových souborech z České republiky a Polska. Celková úspěšnost naivních bayesovských klasifikátorů používajících entropickou diskretizaci s hybridním předvýběrem vysvětlujících atributů je pro český datový soubor 77,19 %, pro polský 79,63 %. Hodnoty AUC jsou pro příslušné datové soubory 0,81 a 0.87. Dosažené výsledky na polském datovém souboru byly porovnány s již publikovanými články od Tsaie (2009) a Wanga et al. (2014), které aplikují jiné klasifikační algoritmy na stejný datový soubor. Navrhované metody v této práci vycházejí ze srovnání velice úspěšně. Práce dále nabízí srovnání jednotlivých přístupů k diskretizaci numerických atributů a výběru relevantních vysvětlujících atributů. Tyto oblasti se ukazují pro zvýšení výkonnosti naivního bayesovského klasifikátoru jako klíčové.
Keywords: Naivní baysovský kalsifikátor; Výběr vysvětlujících atributů; Diskretizace numerických atributů; Predikce korporátních bankrotů; Bayesovská klasifikace
Thesis title: Corporate Bankruptcy Prediction Using Bayesian Classifiers
Author: Hátle, Lukáš
Thesis type: Diploma thesis
Supervisor: Witzany, Jiří
Opponents: Málek, Jiří
Thesis language: Česky
Abstract:
The aim of this study is to evaluate feasibility of using Bayes classifiers for predicting corporate bankruptcies. The results obtain show that Bayes classifiers do reach comparable results to then more commonly used methods such the logistic regression and the decision trees. The comparison has been carried out based on Czech and Polish data sets. The overall accuracy rate of these so called naive Bayes classifiers, using entropic discretization along with the hybrid pre-selection of the explanatory attributes, reaches 77.19 % for the Czech dataset and 79.76 % for the Polish set respectively. The AUC values for these data sets are 0.81 and 0.87. The results obtained for the Polish data set have been compared to the already published articles by Tsai (2009) and Wang et al. (2014) who applied different classification algorithms. The method proposed in my study, when compared to the above earlier works, comes out as quite successful. The thesis also includes comparing various approaches as regards the discretisation of numerical attributes and selecting the relevant explanatory attributes. These are the key issues for increasing performance of the naive Bayes classifiers
Keywords: Naive Bayes classifiers; Feature selection; Discretization of continuous variables; Bayes classification; Corporate bankruptcy prediction

Information about study

Study programme: Finance a účetnictví/Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 8. 4. 2014
Date of submission: 31. 8. 2014
Date of defense: 5. 12. 2014
Identifier in the InSIS system: https://insis.vse.cz/zp/47525/podrobnosti

Files for download

    Last update: