Application of Process of Knowledge Discovery from Databases to Data from the Insolvency Register of the Czech Republic
Thesis title: | Využití procesu získávání znalostí z databází na data z insolvenčního rejstříku ČR |
---|---|
Author: | Kadlec, Karel |
Thesis type: | Diplomová práce |
Supervisor: | Rauch, Jan |
Opponents: | Chudán, David |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá procesem dobývání znalostí z databází na reálných datech z insolvenčního rejstříku České republiky. Počet insolvenčních řízení je jedním z vážných problémů současné společnosti. Vzhledem k tomu, že informace o jejich průběhu jsou detailně zaznamenané v insolvenčním rejstříku, je možné na data uplatnit metody datové analýzy a získat poznatky, které by mohly pomoci v pochopení hlubších souvislostí.Cílem této diplomové práce je v souladu s metodikou CRISP-DM analyzovat oblast insolvenčních řízení z legislativního a procesního pohledu, analyzovat strukturu a význam dat z insolvenčního rejstříku, připravit pomocí transformací a přidáním dodatečných informací z externích zdrojů data pro analýzu a následně aplikovat procedury datové analýzy, které by mohly přinést doposud neidentifikované souvislosti, trendy a příčiny některých problémů. Dílčím cílem je analýza příčin, podmínek a důsledků exponenciálního růstu objemu generovaných dat, možností jejich využití a stejně tak z toho plynoucích rizik. Dalším dílčím cílem je validace použitelnosti metodiky CRISP-DM, která je použita v praktické části, včetně ověření odhadů pracnosti jednotlivých fází na reálné úloze. |
Keywords: | Insolvenční rejstřík; GUHA metoda; LISp-Miner; CRISP-DM; datová analýza; insolvenční proces; oddlužení; konkurz; Big Data |
Thesis title: | Application of Process of Knowledge Discovery from Databases to Data from the Insolvency Register of the Czech Republic |
---|---|
Author: | Kadlec, Karel |
Thesis type: | Diploma thesis |
Supervisor: | Rauch, Jan |
Opponents: | Chudán, David |
Thesis language: | Česky |
Abstract: | This diploma thesis deals with the process of Knowledge Discovery and Data Mining applied to the database from the Czech Republic registry of insolvencies. The number of insolvency proceedings is one of the serious problems of contemporary society. Given that information on their progress is recorded in detail in the insolvency register, it is possible to apply data analysis methods to the data and gain knowledge that could help in understanding the deeper context.The aim of this thesis is, in accordance with CRISP-DM methodology, to analyze the area of insolvency proceedings from the legislative and procedural point of view, to analyze the structure and meaning of data from the insolvency register and to use transformations and external sources to prepare data for data analysis procedures that could reveal some new views, connections, trends and causes of some problems.A partial goal is to analyze the causes, conditions and consequences of exponential growth in the volume of generated data, the possibilities of their use, as well as the resulting risks. Another partial goal is to validate the applicability of CRISP-DM methodology, which is used in the practical part, including verification of estimates of labor intensity of individual phases on a real task. |
Keywords: | GUHA method; LISp-Miner; CRISP-DM; data analysis; insolvency process; debt relief; bankruptcy; Insolvency register; Big Data |
Information about study
Study programme: | Aplikovaná informatika/Podniková informatika |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 26. 3. 2019 |
---|---|
Date of submission: | 2. 12. 2019 |
Date of defense: | 31. 1. 2020 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/69352/podrobnosti |