Analýza a klasifikace datových souborů GTZAN a SUNO pomocí metod strojového učení v jazyce Python
| Název práce: | Analýza a klasifikace datových souborů GTZAN a SUNO pomocí metod strojového učení v jazyce Python |
|---|---|
| Autor(ka) práce: | Svoboda, Tomáš |
| Typ práce: | Bakalářská práce |
| Vedoucí práce: | Vomlel, Jiří |
| Oponenti práce: | Kliegr, Tomáš |
| Jazyk práce: | Česky |
| Abstrakt: | Tato bakalářská práce se zabývá komparativní analýzou hudebních dat skladeb vytvořených člověkem a syntetických skladeb generovaných umělou inteligencí. Hlavním cílem je posoudit akustickou a stylovou rozmanitost současné generativní umělé inteligence (genAI) v porovnání s lidskou tvorbou a vyhodnotit schopnost modelů strojového učení tyto dva zdroje od sebe odlišit. Teoretická část vymezuje hudební pojmy v kontextu digitálního zpracování signálu a popisuje extrakci klíčových akustických příznaků, jako jsou MFCC, chroma features a další. Praktická část využívá datové sady GTZAN a SUNO, nad kterými je provedena strukturální analýza pomocí metody hlavních komponent (PCA). Následně jsou implementovány klasifikační modely (logistická regrese a náhodné lesy) pro detekci původu hudby a klasifikaci žánrů. Výsledky práce identifikují rozdíly datových sad a diskutují výsledky analýzy a úspěšnost algoritmů strojového učení. |
| Klíčová slova: | SUNO; akustické příznaky; Umělá inteligence; Music Information Retrieval; strojové učení; algoritmy; PCA; klasifikace hudby; GTZAN; Python |
| Název práce: | Analysis and Classification of GTZAN and SUNO Datasets Using Machine Learning Methods in Python |
|---|---|
| Autor(ka) práce: | Svoboda, Tomáš |
| Typ práce: | Bachelor thesis |
| Vedoucí práce: | Vomlel, Jiří |
| Oponenti práce: | Kliegr, Tomáš |
| Jazyk práce: | Česky |
| Abstrakt: | This bachelor's thesis deals with the comparative analysis of musical data from human-composed tracks and synthetic tracks generated by artificial intelligence. The main objective is to assess the acoustic and stylistic diversity of current generative artificial intelligence (genAI) in comparison to human creation, and to evaluate the ability of machine learning models to distinguish between these two sources. The theoretical part defines musical concepts within the context of Digital Signal Processing and describes the extraction of key acoustic features, such as MFCCs, chroma features, and others. The practical part utilizes the GTZAN and SUNO datasets, upon which structural analysis is performed using principal component analysis (PCA). Subsequently, classification models (logistic regression and random forest) are implemented for music origin detection and genre classification. The results of the thesis identify the differences between the datasets and discuss the outcomes of the analysis as well as the success rate of the machine learning algorithms. |
| Klíčová slova: | Music Information Retrieval; machine learning; acoustic features; PCA; algorithms; music classification; SUNO; Python; GTZAN; Artificial intelligence |
Informace o studiu
| Studijní program / obor: | Aplikovaná informatika |
|---|---|
| Typ studijního programu: | Bakalářský studijní program |
| Přidělovaná hodnost: | Bc. |
| Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
| Fakulta: | Fakulta informatiky a statistiky |
| Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
| Datum zadání práce: | 30. 6. 2025 |
|---|---|
| Datum podání práce: | 10. 5. 2026 |
| Datum obhajoby: | 23. 6. 2026 |
| Identifikátor v systému InSIS: | https://insis.vse.cz/zp/92911/podrobnosti |