Algoritmy na analýzu kategoriálnych dát a ich podpora v balíčkoch pre Data Science
Autor(ka) práce:
Franek, Rastislav
Typ práce:
Diplomová práce
Vedoucí práce:
Máša, Petr
Oponenti práce:
Chudán, David
Jazyk práce:
Slovensky
Abstrakt:
Táto diplomová práca sa zameriava na pokročilú analýzu kategoriálnych dát, ktoré zohrávajú kľúčovú úlohu v rôznych vedeckých a priemyselných aplikáciách. Keďže väčšina existujúcich algoritmov je primárne navrhnutá na prácu s numerickými dátami, je nevyhnutné špecifikovať prístupy, ktoré sú optimalizované pre kategoriálne dáta. Práca sa sústreďuje na identifikáciu relevantných algoritmov a porovnanie frameworkov v jazyku Python, ktoré sú vhodné na pokročilú analýzu kategoriálnych dát v oblasti dátovej vedy. Hlavným cieľom bolo analyzovať a porovnať frameworky poskytujúce rôznorodú podporu pre spracovanie kategoriálnych dát. Súčasťou práce je deskriptívna a experimentálna analýza, ktorá hodnotí vybrané nástroje na základe preddefinovaných kritérií, ako sú presnosť, časová výkonnosť, možnosti predspracovania dát a podpora natívnych algoritmov. Výsledky analýz poskytujú cenné poznatky o teoretických a praktických aspektoch jednotlivých nástrojov. Získané poznatky boli aplikované na vytvorenie kvantifikovanej hodnotiacej matice, ktorá zdôrazňuje silné a slabé stránky analyzovaných frameworkov a poskytuje praktické odporúčania pre ich použitie. Táto práca prispieva k lepšiemu pochopeniu možností analýzy kategoriálnych dát a predstavuje užitočný zdroj pre odborníkov a študentov v oblasti dátovej vedy.
Algoritmy na analýzu kategoriálních dat a jejich podpora v balíčcích pro Data Science
Autor(ka) práce:
Franek, Rastislav
Typ práce:
Diplomová práce
Vedoucí práce:
Máša, Petr
Oponenti práce:
Chudán, David
Jazyk práce:
Slovensky
Abstrakt:
Tato diplomová práce se zaměřuje na pokročilou analýzu kategoriálních dat, která hrají klíčovou roli v různých vědeckých a průmyslových aplikacích. Vzhledem k tomu, že většina existujících algoritmů je primárně navržena pro práci s numerickými daty, je nezbytné specifikovat přístupy, které jsou optimalizované pro práci s kategoriálními daty. Práce se soustředí na identifikaci relevantních algoritmů a porovnání frameworků v jazyce Python, které jsou vhodné pro pokročilou analýzu kategoriálních dat v oblasti datové vědy. Hlavním cílem bylo analyzovat a porovnat frameworky poskytující různorodou podporu pro zpracování kategoriálních dat. Součástí práce je deskriptivní a experimentální analýza, která hodnotí vybrané nástroje na základě předdefinovaných kritérií, jako jsou přesnost, časová výkonnost, možnosti předzpracování dat a podpora natívních algoritmů. Výsledky analýz poskytují cenné poznatky o teoretických a praktických aspektech jednotlivých nástrojů. Získané poznatky byly aplikovány na vytvoření kvantifikované hodnotící matice, která zdůrazňuje silné a slabé stránky analyzovaných frameworků a poskytuje praktická doporučení pro jejich použití. Tato práce přispívá k lepšímu pochopení možností analýzy kategoriálních dat a představuje užitečný zdroj pro odborníky a studenty v oblasti datové vědy.
Klíčová slova:
Kategoriální data; Dátová věda; Python; Pokročilá analýza dat; Algoritmy pro kategoriální data
Název práce:
Algorithms for categorical data analysis and their support in Data Science packages
Autor(ka) práce:
Franek, Rastislav
Typ práce:
Diploma thesis
Vedoucí práce:
Máša, Petr
Oponenti práce:
Chudán, David
Jazyk práce:
Slovensky
Abstrakt:
This thesis focuses on advanced categorical data analysis, which plays a key role in various scientific and industrial applications. Since most existing algorithms are primarily designed to work with numerical data, it is essential to specify approaches optimized for categorical data. The study concentrates on identifying relevant algorithms and comparing Python frameworks suitable for advanced categorical data analysis within the field of data science. The primary objective was to analyze and compare frameworks offering diverse support for processing categorical data. The thesis includes descriptive and experimental analyses evaluating selected tools based on predefined criteria such as accuracy, computational performance, data preprocessing capabilities, and support for native algorithms. The results provide valuable insights into the theoretical and practical aspects of each tool. The findings were utilized to create a quantified evaluation matrix, highlighting the strengths and weaknesses of the analyzed frameworks and offering practical recommendations for their application. This research contributes to a better understanding of the possibilities for categorical data analysis and serves as a valuable resource for professionals and students in the field of data science.
Klíčová slova:
Data science; Algorithms for categorical data; Advanced data analysis; Categorical data; Python