Analýza a klasifikace datových souborů GTZAN a SUNO pomocí metod strojového učení v jazyce Python

Název práce: Analýza a klasifikace datových souborů GTZAN a SUNO pomocí metod strojového učení v jazyce Python
Autor(ka) práce: Svoboda, Tomáš
Typ práce: Bakalářská práce
Vedoucí práce: Vomlel, Jiří
Oponenti práce: Kliegr, Tomáš
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zabývá komparativní analýzou hudebních dat skladeb vytvořených člověkem a syntetických skladeb generovaných umělou inteligencí. Hlavním cílem je posoudit akustickou a stylovou rozmanitost současné generativní umělé inteligence (genAI) v porovnání s lidskou tvorbou a vyhodnotit schopnost modelů strojového učení tyto dva zdroje od sebe odlišit. Teoretická část vymezuje hudební pojmy v kontextu digitálního zpracování signálu a popisuje extrakci klíčových akustických příznaků, jako jsou MFCC, chroma features a další. Praktická část využívá datové sady GTZAN a SUNO, nad kterými je provedena strukturální analýza pomocí metody hlavních komponent (PCA). Následně jsou implementovány klasifikační modely (logistická regrese a náhodné lesy) pro detekci původu hudby a klasifikaci žánrů. Výsledky práce identifikují rozdíly datových sad a diskutují výsledky analýzy a úspěšnost algoritmů strojového učení.
Klíčová slova: SUNO; akustické příznaky; Umělá inteligence; Music Information Retrieval; strojové učení; algoritmy; PCA; klasifikace hudby; GTZAN; Python
Název práce: Analysis and Classification of GTZAN and SUNO Datasets Using Machine Learning Methods in Python
Autor(ka) práce: Svoboda, Tomáš
Typ práce: Bachelor thesis
Vedoucí práce: Vomlel, Jiří
Oponenti práce: Kliegr, Tomáš
Jazyk práce: Česky
Abstrakt:
This bachelor's thesis deals with the comparative analysis of musical data from human-composed tracks and synthetic tracks generated by artificial intelligence. The main objective is to assess the acoustic and stylistic diversity of current generative artificial intelligence (genAI) in comparison to human creation, and to evaluate the ability of machine learning models to distinguish between these two sources. The theoretical part defines musical concepts within the context of Digital Signal Processing and describes the extraction of key acoustic features, such as MFCCs, chroma features, and others. The practical part utilizes the GTZAN and SUNO datasets, upon which structural analysis is performed using principal component analysis (PCA). Subsequently, classification models (logistic regression and random forest) are implemented for music origin detection and genre classification. The results of the thesis identify the differences between the datasets and discuss the outcomes of the analysis as well as the success rate of the machine learning algorithms.
Klíčová slova: Music Information Retrieval; machine learning; acoustic features; PCA; algorithms; music classification; SUNO; Python; GTZAN; Artificial intelligence

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 30. 6. 2025
Datum podání práce: 10. 5. 2026
Datum obhajoby: 23. 6. 2026
Identifikátor v systému InSIS: https://insis.vse.cz/zp/92911/podrobnosti

Soubory ke stažení

    Poslední aktualizace: