Porovnání implementací automatického strojového učení na reálných datech

Název práce: Porovnání implementací automatického strojového učení na reálných datech
Autor(ka) práce: Chernaya, Maria
Typ práce: Diplomová práce
Vedoucí práce: Chudán, David
Oponenti práce: Berka, Petr
Jazyk práce: Česky
Abstrakt:
Tématem diplomové práce je porovnání implementací automatického strojového učení na reálných datech. Reaguje na dnešní naléhavou potřebu lepšího a zároveň relativně jednoduchého způsobu analýzy dat. Cílem diplomové práce je provést s využitím různých implementací automatického strojového učení regresní analýzu na reálných soutěžních datech z platformy Kaggle, která organizuje soutěže v oblasti datové vědy, a porovnat výsledky těchto implementací. Analytická část práce obsahuje průzkum současného stavu badání v oblasti automatického strojového učení s krátkým úvodem do problematiky strojového učení. Dále jsou představena možná prostředí pro použití automatického strojového učení, jak programovací knihovny, tak i hotová řešení s uživatelským rozhraním. V rámci praktické části práce byla provedena samotná analýza soutěžních dat z online platformy organizování soutěží v oblasti analýzy dat a strojového učení. Analýza je provedena několika různými způsoby včetně použití knihoven Python pro automatické strojové učení a několika cloud platforem, které mají k dispozici funkci automatického strojového učení. V závěru je provedeno shrnutí vytvořených modelů, vyhodnocení a porovnání jednotlivých výsledků.
Klíčová slova: Automated machine learning; Analýza dat; Umělá inteligence; Učení modelu; Cloud platforma
Název práce: Comparison of implementations of automatic machine learning on real data
Autor(ka) práce: Chernaya, Maria
Typ práce: Diploma thesis
Vedoucí práce: Chudán, David
Oponenti práce: Berka, Petr
Jazyk práce: Česky
Abstrakt:
The topic of the thesis is a comparison of implementations of automated machine learning on real data. It meets today's pressing need for a better yet relatively simple way to analyse data. The aim of the thesis is to perform regression analysis using different implementations of automated machine learning on real competition data from the Kaggle platform, which organises competitions in the field of data science, and compare the results of these implementations. The analytical part of the work provides an overview of the current state of research in the field of automated machine learning with a short introduction to machine learning issues. There are also introduced possible environments for using automated machine learning, both programming libraries and ready-made solutions with a user interface. As section of the practical part of the work, the analysis of competition data from an online platform for organising competitions in the field of data analysis and machine learning was carried out. The analysis is done in a number of ways, including using Python libraries for automated machine learning and multiple cloud platforms. At the end, the created models are summarised, the individual results are evaluated and compared.
Klíčová slova: Automated machine learning; Data analysis; Artificial intelligence; Learning model; Cloud platfotm

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 13. 11. 2020
Datum podání práce: 6. 12. 2021
Datum obhajoby: 21. 1. 2022
Identifikátor v systému InSIS: https://insis.vse.cz/zp/75136/podrobnosti

Soubory ke stažení

    Poslední aktualizace: