Comparison of implementations of automatic machine learning on real data

Thesis title: Porovnání implementací automatického strojového učení na reálných datech
Author: Chernaya, Maria
Thesis type: Diplomová práce
Supervisor: Chudán, David
Opponents: Berka, Petr
Thesis language: Česky
Abstract:
Tématem diplomové práce je porovnání implementací automatického strojového učení na reálných datech. Reaguje na dnešní naléhavou potřebu lepšího a zároveň relativně jednoduchého způsobu analýzy dat. Cílem diplomové práce je provést s využitím různých implementací automatického strojového učení regresní analýzu na reálných soutěžních datech z platformy Kaggle, která organizuje soutěže v oblasti datové vědy, a porovnat výsledky těchto implementací. Analytická část práce obsahuje průzkum současného stavu badání v oblasti automatického strojového učení s krátkým úvodem do problematiky strojového učení. Dále jsou představena možná prostředí pro použití automatického strojového učení, jak programovací knihovny, tak i hotová řešení s uživatelským rozhraním. V rámci praktické části práce byla provedena samotná analýza soutěžních dat z online platformy organizování soutěží v oblasti analýzy dat a strojového učení. Analýza je provedena několika různými způsoby včetně použití knihoven Python pro automatické strojové učení a několika cloud platforem, které mají k dispozici funkci automatického strojového učení. V závěru je provedeno shrnutí vytvořených modelů, vyhodnocení a porovnání jednotlivých výsledků.
Keywords: Automated machine learning; Analýza dat; Umělá inteligence; Učení modelu; Cloud platforma
Thesis title: Comparison of implementations of automatic machine learning on real data
Author: Chernaya, Maria
Thesis type: Diploma thesis
Supervisor: Chudán, David
Opponents: Berka, Petr
Thesis language: Česky
Abstract:
The topic of the thesis is a comparison of implementations of automated machine learning on real data. It meets today's pressing need for a better yet relatively simple way to analyse data. The aim of the thesis is to perform regression analysis using different implementations of automated machine learning on real competition data from the Kaggle platform, which organises competitions in the field of data science, and compare the results of these implementations. The analytical part of the work provides an overview of the current state of research in the field of automated machine learning with a short introduction to machine learning issues. There are also introduced possible environments for using automated machine learning, both programming libraries and ready-made solutions with a user interface. As section of the practical part of the work, the analysis of competition data from an online platform for organising competitions in the field of data analysis and machine learning was carried out. The analysis is done in a number of ways, including using Python libraries for automated machine learning and multiple cloud platforms. At the end, the created models are summarised, the individual results are evaluated and compared.
Keywords: Automated machine learning; Data analysis; Artificial intelligence; Learning model; Cloud platfotm

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 13. 11. 2020
Date of submission: 6. 12. 2021
Date of defense: 21. 1. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/75136/podrobnosti

Files for download

    Last update: