Analysis of data concerning risk of suicide in mentally ill patients

Thesis title: Analysis of data concerning risk of suicide in mentally ill patients
Author: Hron, Jiří
Thesis type: Bachelor thesis
Supervisor: Rauch, Jan
Opponents: Malá, Ivana
Thesis language: English
Abstract:
The three goals of this thesis are to present a coherent overview of the research on suicide in both the general population and among mentally ill, to analyse records of hospitalisations of mentally ill from years 2006 to 2012 while looking for patterns either leading to identification of suicide risk factors or useful for predicting probability of suicide at the time of discharge, and finally to compare a selected subset of statistical, data mining and machine learning methods in relation to their applicability to the second goal. The overview is based on information from over 40 published articles. The analysis and the comparison make use of associative rules mining, visual and stepwise methods for exploration, standard and conditional logistic regression models for inference, and variations of random forests for prediction. To the best of author's knowledge, none of the three goals was previously pursued by any other researcher in the Czech Republic, certainly not using the data set provided for purposes of this thesis. A new modification of random forest combined with a set of logistic regression in order to refine prediction accuracy is also briefly explored. The structure closely follows the above--stated goals starting from the chapters on related work and on the theoretical basis of the methods used, and concluding by the analysis itself and discussion of its results.
Keywords: machine learning; suicide risk; statistical inference
Thesis title: Analýza dat týkajících se risku sebevraždy u mentálně nemocných
Author: Hron, Jiří
Thesis type: Bakalářská práce
Supervisor: Rauch, Jan
Opponents: Malá, Ivana
Thesis language: English
Abstract:
Cíle této práce jsou poskytnutí uceleného přehledu poznatků o sebevraždách jak mezi obecnou populací, tak specificky mezi mentálně postiženými pacienty, analýza záznamů o hospitalizacích mentálně postižených pacientů mezi lety 2006 a 2008 s důrazem na nalezení potencionálních rizikových faktorů sebevraždy nebo informací vhodných pro predikci pravděpodobnosti sebevraždy v době propuštění z lékařského zařízení, a konečně porovnání vybraných statistických metod v kontrastu k metodám strojového učení a dobývání znalostí z databází ve vztahu k předchozímu úkolu. Přehled je založen na poznatcíh z více jak 40 odborných článků. Analýza a porovnání metod využívá metod pro těžení asociativních pravidel, vizuálních a krokových metod pro exploraci dat, logistické a podmíněné logistické regrese pro analytickou část, a tzv. textit{random forest} modelu pro predikci. Autor si není vědom existence jakékoliv práce na témata stanovená pro tuto tezi vypracované na území České republiky, přičemž tato témata jistě nikdy nebyla zkoumána nad datovým souborem poskytnutým pro účely této teze. Dalším původním přínosem autora je krátký popis a otestování nové verze učícího algoritmu založená na kombinaci textit{random forest} a setu logistických regresních modelů použitých pro zpřesnění odhadů produkovaných prvním z modelů. Struktura sleduje výše uvedené cíle začínaje od kapitol o poznatcích předchozího výzkumu a o teoretických základech použitých metod a konče vlastní analýzou a interpretací výsledků.
Keywords: strojové učení; rizika sebevražd; statistická inference

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 9. 12. 2014
Date of submission: 31. 5. 2015
Date of defense: 22. 6. 2015
Identifier in the InSIS system: https://insis.vse.cz/zp/50545/podrobnosti

Files for download

    Last update: