Application of Process of Knowledge Discovery from Databases to Data from the Insolvency Register of the Czech Republic

Thesis title: Využití procesu získávání znalostí z databází na data z insolvenčního rejstříku ČR
Author: Kadlec, Karel
Thesis type: Diplomová práce
Supervisor: Rauch, Jan
Opponents: Chudán, David
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá procesem dobývání znalostí z databází na reálných datech z insolvenčního rejstříku České republiky. Počet insolvenčních řízení je jedním z vážných problémů současné společnosti. Vzhledem k tomu, že informace o jejich průběhu jsou detailně zaznamenané v insolvenčním rejstříku, je možné na data uplatnit metody datové analýzy a získat poznatky, které by mohly pomoci v pochopení hlubších souvislostí.Cílem této diplomové práce je v souladu s metodikou CRISP-DM analyzovat oblast insolvenčních řízení z legislativního a procesního pohledu, analyzovat strukturu a význam dat z insolvenčního rejstříku, připravit pomocí transformací a přidáním dodatečných informací z externích zdrojů data pro analýzu a následně aplikovat procedury datové analýzy, které by mohly přinést doposud neidentifikované souvislosti, trendy a příčiny některých problémů. Dílčím cílem je analýza příčin, podmínek a důsledků exponenciálního růstu objemu generovaných dat, možností jejich využití a stejně tak z toho plynoucích rizik. Dalším dílčím cílem je validace použitelnosti metodiky CRISP-DM, která je použita v praktické části, včetně ověření odhadů pracnosti jednotlivých fází na reálné úloze.
Keywords: Insolvenční rejstřík; GUHA metoda; LISp-Miner; CRISP-DM; datová analýza; insolvenční proces; oddlužení; konkurz; Big Data
Thesis title: Application of Process of Knowledge Discovery from Databases to Data from the Insolvency Register of the Czech Republic
Author: Kadlec, Karel
Thesis type: Diploma thesis
Supervisor: Rauch, Jan
Opponents: Chudán, David
Thesis language: Česky
Abstract:
This diploma thesis deals with the process of Knowledge Discovery and Data Mining applied to the database from the Czech Republic registry of insolvencies. The number of insolvency proceedings is one of the serious problems of contemporary society. Given that information on their progress is recorded in detail in the insolvency register, it is possible to apply data analysis methods to the data and gain knowledge that could help in understanding the deeper context.The aim of this thesis is, in accordance with CRISP-DM methodology, to analyze the area of insolvency proceedings from the legislative and procedural point of view, to analyze the structure and meaning of data from the insolvency register and to use transformations and external sources to prepare data for data analysis procedures that could reveal some new views, connections, trends and causes of some problems.A partial goal is to analyze the causes, conditions and consequences of exponential growth in the volume of generated data, the possibilities of their use, as well as the resulting risks. Another partial goal is to validate the applicability of CRISP-DM methodology, which is used in the practical part, including verification of estimates of labor intensity of individual phases on a real task.
Keywords: GUHA method; LISp-Miner; CRISP-DM; data analysis; insolvency process; debt relief; bankruptcy; Insolvency register; Big Data

Information about study

Study programme: Aplikovaná informatika/Podniková informatika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 26. 3. 2019
Date of submission: 2. 12. 2019
Date of defense: 31. 1. 2020
Identifier in the InSIS system: https://insis.vse.cz/zp/69352/podrobnosti

Files for download

    Last update: