Comparison of implementations of automatic machine learning on real data
Thesis title: | Porovnání implementací automatického strojového učení na reálných datech |
---|---|
Author: | Chernaya, Maria |
Thesis type: | Diplomová práce |
Supervisor: | Chudán, David |
Opponents: | Berka, Petr |
Thesis language: | Česky |
Abstract: | Tématem diplomové práce je porovnání implementací automatického strojového učení na reálných datech. Reaguje na dnešní naléhavou potřebu lepšího a zároveň relativně jednoduchého způsobu analýzy dat. Cílem diplomové práce je provést s využitím různých implementací automatického strojového učení regresní analýzu na reálných soutěžních datech z platformy Kaggle, která organizuje soutěže v oblasti datové vědy, a porovnat výsledky těchto implementací. Analytická část práce obsahuje průzkum současného stavu badání v oblasti automatického strojového učení s krátkým úvodem do problematiky strojového učení. Dále jsou představena možná prostředí pro použití automatického strojového učení, jak programovací knihovny, tak i hotová řešení s uživatelským rozhraním. V rámci praktické části práce byla provedena samotná analýza soutěžních dat z online platformy organizování soutěží v oblasti analýzy dat a strojového učení. Analýza je provedena několika různými způsoby včetně použití knihoven Python pro automatické strojové učení a několika cloud platforem, které mají k dispozici funkci automatického strojového učení. V závěru je provedeno shrnutí vytvořených modelů, vyhodnocení a porovnání jednotlivých výsledků. |
Keywords: | Automated machine learning; Analýza dat; Umělá inteligence; Učení modelu; Cloud platforma |
Thesis title: | Comparison of implementations of automatic machine learning on real data |
---|---|
Author: | Chernaya, Maria |
Thesis type: | Diploma thesis |
Supervisor: | Chudán, David |
Opponents: | Berka, Petr |
Thesis language: | Česky |
Abstract: | The topic of the thesis is a comparison of implementations of automated machine learning on real data. It meets today's pressing need for a better yet relatively simple way to analyse data. The aim of the thesis is to perform regression analysis using different implementations of automated machine learning on real competition data from the Kaggle platform, which organises competitions in the field of data science, and compare the results of these implementations. The analytical part of the work provides an overview of the current state of research in the field of automated machine learning with a short introduction to machine learning issues. There are also introduced possible environments for using automated machine learning, both programming libraries and ready-made solutions with a user interface. As section of the practical part of the work, the analysis of competition data from an online platform for organising competitions in the field of data analysis and machine learning was carried out. The analysis is done in a number of ways, including using Python libraries for automated machine learning and multiple cloud platforms. At the end, the created models are summarised, the individual results are evaluated and compared. |
Keywords: | Automated machine learning; Data analysis; Artificial intelligence; Learning model; Cloud platfotm |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 13. 11. 2020 |
---|---|
Date of submission: | 6. 12. 2021 |
Date of defense: | 21. 1. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/75136/podrobnosti |