Cluster generator for cluster analysis

Thesis title: Generátor shluků pro shlukovou analýzu
Author: Červenka, David
Thesis type: Diplomová práce
Supervisor: Pavlíček, Luboš
Opponents: Löster, Tomáš
Thesis language: Česky
Abstract:
Cílem této diplomové práce je rozšíření desktopové aplikace generátoru shluků vytvořenou v rámci bakalářské práce „Návrh a vývoj generátoru shluků pro shlukovou analýzu“. Tato práce shrnuje problematiku při generování náhodných čísel podle určitého pravděpodobnostního rozdělení zachycenou ve zmíněné bakalářské práci a při samotném rozvoji této aplikace. Pro její vývoj byl použit programovací jazyk Java. V první části jsou stručně shrnuty statistické metody a teorie, které se v aplikaci vyskytují a jsou potřebné pro pochopení problematiky. Následně v druhé části jsou zpracovány a popsány požadavky na rozvoj této aplikace. Všechny tyto požadavky byly vytvořeny na základě dotazníků poskytnutých lidem, kteří aplikaci využívali a měli nápady na její vylepšení. Závěrečná část se věnuje samotné implementaci definovaných požadavků. Závěr práce obsahuje shrnutí dosažených výsledků a zhodnocení celé práce. Výsledkem této práce je funkční aplikace pro generování shluků pomocí čísel vygenerovaných pomocí určeného pravděpodobnostního rozdělení. Toto je možné využít zejména ve shlukové analýze, ale také navíc v diskriminační analýze, což je další vícerozměrná statistická metoda. Pro tuto metodu lze výstupy použít z důvodu, že uživatel zná rozdělení objektů do skupin předem, což je podmínkou této metody. Uživatel při tvorbě shluků může volit počet vytvořených shluků, počet proměnných, které charakterizují jednotlivé objekty, typ pravděpodobnostního rozdělení, variabilitu uvnitř shluků, míru separace shluků, která je dána jejich procentem překrytí shluků a další modifikovatelné vstupy koncového uživatele. Na základě této upravené aplikace bude možné využívat a hodnotit shlukovací metody z různých hledisek, což stále vytváří prostor pro další vědecký výzkum, včetně již zmíněné diskriminační analýzy.
Keywords: návrh rozšíření aplikace; JavaFx; jazyk UML; Git; generátor náhodných čísel; shluková analýza; pravděpodobnostní rozdělení; Java; rozvoj aplikace
Thesis title: Cluster generator for cluster analysis
Author: Červenka, David
Thesis type: Diploma thesis
Supervisor: Pavlíček, Luboš
Opponents: Löster, Tomáš
Thesis language: Česky
Abstract:
The aim of this diploma thesis is to extend the desktop application of the cluster generator created within the bachelor's thesis "Design and development of a cluster generator for cluster analysis". This work summarizes the issue of generating random numbers according to a certain probability distribution captured in the bachelor's thesis and the development of this application. The Java programming language was used for its development. The first part briefly summarizes the statistical methods and theories that occur in the application and are needed to understand the issue. Subsequently, in the second part, the requirements for the development of this application are processed and described. All these requirements were created on the basis of questionnaires provided to people who used the application and had ideas for its improvement. The final part deals with the implementation of defined requirements. The conclusion of the thesis contains a summary of the achieved results and an evaluation of the whole work. The result of this work is a functional application for generating clusters using numbers generated using a specified probability distribution. This can be used mainly in cluster analysis, but also in discriminant analysis, which is another multidimensional statistical method. Outputs can be used for this method because the user knows the division of objects into groups in advance, which is a condition of this method. When creating clusters, the user can select the number of clusters created, the number of variables that characterize each object, the type of probability distribution, variability within clusters, the degree of cluster separation given by their cluster overlap percentage, and other modifiable end-user inputs. Based on this modified application, it will be possible to use and evaluate clustering methods from various perspectives, which still creates space for further scientific research, including the already mentioned discriminant analysis.
Keywords: Java; application development; application extension design; JavaFx; UML language; Git; random number generator; cluster analysis; probability distribution

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 2. 10. 2019
Date of submission: 7. 12. 2020
Date of defense: 26. 1. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/70981/podrobnosti

Files for download

    Last update: