Porovnání implementací automatického strojového učení na reálných datech
Název práce: | Porovnání implementací automatického strojového učení na reálných datech |
---|---|
Autor(ka) práce: | Chernaya, Maria |
Typ práce: | Diplomová práce |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Berka, Petr |
Jazyk práce: | Česky |
Abstrakt: | Tématem diplomové práce je porovnání implementací automatického strojového učení na reálných datech. Reaguje na dnešní naléhavou potřebu lepšího a zároveň relativně jednoduchého způsobu analýzy dat. Cílem diplomové práce je provést s využitím různých implementací automatického strojového učení regresní analýzu na reálných soutěžních datech z platformy Kaggle, která organizuje soutěže v oblasti datové vědy, a porovnat výsledky těchto implementací. Analytická část práce obsahuje průzkum současného stavu badání v oblasti automatického strojového učení s krátkým úvodem do problematiky strojového učení. Dále jsou představena možná prostředí pro použití automatického strojového učení, jak programovací knihovny, tak i hotová řešení s uživatelským rozhraním. V rámci praktické části práce byla provedena samotná analýza soutěžních dat z online platformy organizování soutěží v oblasti analýzy dat a strojového učení. Analýza je provedena několika různými způsoby včetně použití knihoven Python pro automatické strojové učení a několika cloud platforem, které mají k dispozici funkci automatického strojového učení. V závěru je provedeno shrnutí vytvořených modelů, vyhodnocení a porovnání jednotlivých výsledků. |
Klíčová slova: | Automated machine learning; Analýza dat; Umělá inteligence; Učení modelu; Cloud platforma |
Název práce: | Comparison of implementations of automatic machine learning on real data |
---|---|
Autor(ka) práce: | Chernaya, Maria |
Typ práce: | Diploma thesis |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Berka, Petr |
Jazyk práce: | Česky |
Abstrakt: | The topic of the thesis is a comparison of implementations of automated machine learning on real data. It meets today's pressing need for a better yet relatively simple way to analyse data. The aim of the thesis is to perform regression analysis using different implementations of automated machine learning on real competition data from the Kaggle platform, which organises competitions in the field of data science, and compare the results of these implementations. The analytical part of the work provides an overview of the current state of research in the field of automated machine learning with a short introduction to machine learning issues. There are also introduced possible environments for using automated machine learning, both programming libraries and ready-made solutions with a user interface. As section of the practical part of the work, the analysis of competition data from an online platform for organising competitions in the field of data analysis and machine learning was carried out. The analysis is done in a number of ways, including using Python libraries for automated machine learning and multiple cloud platforms. At the end, the created models are summarised, the individual results are evaluated and compared. |
Klíčová slova: | Automated machine learning; Data analysis; Artificial intelligence; Learning model; Cloud platfotm |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 13. 11. 2020 |
---|---|
Datum podání práce: | 6. 12. 2021 |
Datum obhajoby: | 21. 1. 2022 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/75136/podrobnosti |