Prediction of (pre)diabetes of type two using clinical and laboratory data

Thesis title: Predikce přítomnosti (pre)diabetu mellitu druhého typu na základě klinických a laboratorních dat
Author: Štěpánek, Lubomír
Thesis type: Diplomová práce
Supervisor: Bašta, Milan
Opponents: Sobíšek, Lukáš
Thesis language: Česky
Abstract:
Klinicky vyjádřený diabetes mellitus druhého typu je považován za jeden z~nejvýznamnějších a nejrozsáhlejších medicínských problémů současného západního světa, a to i stran ekonomických nákladů nutných na jeho léčbu. Zatímco diagnostika samotného diabetu melittu druhého typu je již dobře etablovaná, jeho prekurzorová jednotka, prediabetes mellitus druhého typu, je definována pouze některými formálními laboratorními odchylkami od normy, avšak její klinické či jiné laboratorní koreláty nejsou jasně vyjádřeny ani plně známy. Přitom záchyt onemocnění ve fázi prediabetu může vést k vyhnutí se fáze manifestního diabetu pouze pomocí úpravy dietetiky a životního stylu.Cílem této práce je na relativně rozsáhlých klinických a laboratorních datech o pacientech, kteří navštěvovali interní metabolické ambulance Fakultní nemocnice Olomouc v posledních cca deseti letech a jsou v různé fázi onemocnění diabetem druhého typu (tj. někteří již mají diabetes, někteří nemají diabetes a mají prediabetes a zbylí nemají ani prediabetes), predikovat přítomnost (pre)diabetu. Predikce je vnímána jako klasifikační úloha s učitelem ("supervised") a je řešena pomocí běžných algoritmů, tedy prostřednictvím mnohorozměrné logistické regrese, naivních bayesovských klasifikátorů, metody podpůrných vektorů, CART ("classification and regression trees") rozhodovacích stromů, eventuálně i arteficiálních neuronových sítí. Jako nástroj volby pro zpracování dat a provedení analýz slouží jazyk R.Pozornost je věnována i interpretaci výsledků s akcentem na klinické využití a případným kombinacím laboratorních a klinických odchylek od normy, které nejsou běžně klinicky známy a přesto jsou u pacientů s (pre)diabetem druhého typu dle vstupních dat často přítomny, a mohou tak klinickým lékařům sloužit jako varovné indicie nutící pomýšlet na přítomnost (pre)diabetu právě u těch pacientů, kteří nemají takovou diagnózu dosud potvrzenou.
Keywords: rozhodovací strom; naivní bayesovský klasifikátor; neuronová síť; laboratorní data; klinická data; prediabetes mellitus druhého typu; diabetes mellitus druhého typu; predikce; klasifikační úloha; logistická regrese; CART
Thesis title: Prediction of (pre)diabetes of type two using clinical and laboratory data
Author: Štěpánek, Lubomír
Thesis type: Diploma thesis
Supervisor: Bašta, Milan
Opponents: Sobíšek, Lukáš
Thesis language: Česky
Abstract:
Manifesting diabetes mellitus of type two is considered to be one of the most serious problem of today's medicine of the old world.Whereas the diagnostics of the diabetes is established well, its precursor diagnostic unit called prediabets mellitus of type two is defined only using laboratory deviations above or under normal levels. Its clinical manifestation usually stays undetected since its clinical or other laboratory associations remain hidden. However, early detection of the prediabetes could make safe a patient before the diabetes manifestation and could be even easily treated by lifestyle changes.The goal of this Master theses is to predict early phases of the diabetes disease -- the above-spoken prediabetes using large data collected about patients visiting ambulances of internal medicine in School Hospital Olomouc during the last ten years. Some of the patients suffer from diabetes diagnosis, some of them got the prediabetes diagnosis and rest of them are healthy controls. The prediction of (pre)diabetes is considered to be a supervised learning task and is going to be solved using traditional machine-learning algorithms such as multinomial logistic regression, naive Bayes classifiers, support vector machines, CART "classification trees" and artificial neural networks. The R statistical environment is going to be a tool of choice.There will also be some laboratory or clinical deviations above or under normal levels not to be well known in diabetes patients discussed, concerning the fact they could serve as warning flags to physicians dealing with patients not diagnosed but suspected of diagnosis of the diabetes.
Keywords: prediabetes mellitus of type two; diabetes mellitus of type two; CART; prediction; classification task; logistic regression; decision tree; naive Bayes classifier; artificial neural network; laboratory data; clinical data

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 1. 2. 2018
Date of submission: 22. 7. 2019
Date of defense: 22. 8. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/65907/podrobnosti

Files for download

    Last update: