Algorithms for categorical data analysis and their support in Data Science packages
Thesis title: | Algoritmy na analýzu kategoriálnych dát a ich podpora v balíčkoch pre Data Science |
---|---|
Author: | Franek, Rastislav |
Thesis type: | Diploma thesis |
Supervisor: | Máša, Petr |
Opponents: | Chudán, David |
Thesis language: | Slovensky |
Abstract: | Táto diplomová práca sa zameriava na pokročilú analýzu kategoriálnych dát, ktoré zohrávajú kľúčovú úlohu v rôznych vedeckých a priemyselných aplikáciách. Keďže väčšina existujúcich algoritmov je primárne navrhnutá na prácu s numerickými dátami, je nevyhnutné špecifikovať prístupy, ktoré sú optimalizované pre kategoriálne dáta. Práca sa sústreďuje na identifikáciu relevantných algoritmov a porovnanie frameworkov v jazyku Python, ktoré sú vhodné na pokročilú analýzu kategoriálnych dát v oblasti dátovej vedy. Hlavným cieľom bolo analyzovať a porovnať frameworky poskytujúce rôznorodú podporu pre spracovanie kategoriálnych dát. Súčasťou práce je deskriptívna a experimentálna analýza, ktorá hodnotí vybrané nástroje na základe preddefinovaných kritérií, ako sú presnosť, časová výkonnosť, možnosti predspracovania dát a podpora natívnych algoritmov. Výsledky analýz poskytujú cenné poznatky o teoretických a praktických aspektoch jednotlivých nástrojov. Získané poznatky boli aplikované na vytvorenie kvantifikovanej hodnotiacej matice, ktorá zdôrazňuje silné a slabé stránky analyzovaných frameworkov a poskytuje praktické odporúčania pre ich použitie. Táto práca prispieva k lepšiemu pochopeniu možností analýzy kategoriálnych dát a predstavuje užitočný zdroj pre odborníkov a študentov v oblasti dátovej vedy. |
Keywords: | Dátová veda; Pokročilá analýza dát; Algoritmy pre kategoriálne dáta; Kategoriálne dáta; Python |
Thesis title: | Algorithms for categorical data analysis and their support in Data Science packages |
---|---|
Author: | Franek, Rastislav |
Thesis type: | Diploma thesis |
Supervisor: | Máša, Petr |
Opponents: | Chudán, David |
Thesis language: | Slovensky |
Abstract: | This thesis focuses on advanced categorical data analysis, which plays a key role in various scientific and industrial applications. Since most existing algorithms are primarily designed to work with numerical data, it is essential to specify approaches optimized for categorical data. The study concentrates on identifying relevant algorithms and comparing Python frameworks suitable for advanced categorical data analysis within the field of data science. The primary objective was to analyze and compare frameworks offering diverse support for processing categorical data. The thesis includes descriptive and experimental analyses evaluating selected tools based on predefined criteria such as accuracy, computational performance, data preprocessing capabilities, and support for native algorithms. The results provide valuable insights into the theoretical and practical aspects of each tool. The findings were utilized to create a quantified evaluation matrix, highlighting the strengths and weaknesses of the analyzed frameworks and offering practical recommendations for their application. This research contributes to a better understanding of the possibilities for categorical data analysis and serves as a valuable resource for professionals and students in the field of data science. |
Keywords: | Data science; Algorithms for categorical data; Advanced data analysis; Categorical data; Python |
Thesis title: | Algoritmy na analýzu kategoriálních dat a jejich podpora v balíčcích pro Data Science |
---|---|
Author: | Franek, Rastislav |
Thesis type: | Diplomová práce |
Supervisor: | Máša, Petr |
Opponents: | Chudán, David |
Thesis language: | Slovensky |
Abstract: | Tato diplomová práce se zaměřuje na pokročilou analýzu kategoriálních dat, která hrají klíčovou roli v různých vědeckých a průmyslových aplikacích. Vzhledem k tomu, že většina existujících algoritmů je primárně navržena pro práci s numerickými daty, je nezbytné specifikovat přístupy, které jsou optimalizované pro práci s kategoriálními daty. Práce se soustředí na identifikaci relevantních algoritmů a porovnání frameworků v jazyce Python, které jsou vhodné pro pokročilou analýzu kategoriálních dat v oblasti datové vědy. Hlavním cílem bylo analyzovat a porovnat frameworky poskytující různorodou podporu pro zpracování kategoriálních dat. Součástí práce je deskriptivní a experimentální analýza, která hodnotí vybrané nástroje na základě předdefinovaných kritérií, jako jsou přesnost, časová výkonnost, možnosti předzpracování dat a podpora natívních algoritmů. Výsledky analýz poskytují cenné poznatky o teoretických a praktických aspektech jednotlivých nástrojů. Získané poznatky byly aplikovány na vytvoření kvantifikované hodnotící matice, která zdůrazňuje silné a slabé stránky analyzovaných frameworků a poskytuje praktická doporučení pro jejich použití. Tato práce přispívá k lepšímu pochopení možností analýzy kategoriálních dat a představuje užitečný zdroj pro odborníky a studenty v oblasti datové vědy. |
Keywords: | Kategoriální data; Dátová věda; Python; Pokročilá analýza dat; Algoritmy pro kategoriální data |
Information about study
Study programme: | Znalostní a webové technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 29. 3. 2023 |
---|---|
Date of submission: | 2. 12. 2024 |
Date of defense: | 20. 1. 2025 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/84346/podrobnosti |