Comparison of classic and cloud approaches to data mining

Thesis title: Srovnání klasických a cloudových přístupů k data miningu
Author: Eliášek, Milan
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Strnad, Pavel
Thesis language: Česky
Abstract:
Tato práce se zabývá srovnáním klasických on-premise nástrojů pro data mining, v práci zastoupeny nástrojem Orange, a cloudový nástrojů, zastoupeny nástrojem BigML. V úvodu jsou definovány pojmy dolování znalostí z databází a data mining. Následně jsou popsány vybraná kritéria. Poté je provedeno samotné srovnání. Porovnání je provedeno na základě vícekriteriálního hodnocení obou zvolených nástrojů. Konkrétně jejich možnosti nastavení a výstupy pro nahrání a předzpracování dat, tvorbou klasifikačních modelů, které jsou reprezentovány rozhodovacími stromy a logistickou regresí; hledání asociačních pravidel a shlukování, jako poslední kritérium byla vybrána cena a dostupnost nástroje.
Keywords: cloud; rozhodovací stromy; regresní analýza; shluková analýza; asociační pravidla; Data mining
Thesis title: Comparison of classic and cloud approaches to data mining
Author: Eliášek, Milan
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Strnad, Pavel
Thesis language: Česky
Abstract:
This work deals with the comparison of classic on-premise tools for data mining, represented in the work by the Orange tool, and cloud tools, represented by the BigML tool. The introduction defines the concepts of knowledge mining from databases and data mining. Subsequently, selected criteria are described. Then the comparison itself is performed. The comparison is made on the basis of a multi-criteria evaluation of both selected tools. Specifically, their setting options and outputs for data upload and preprocessing, decision tree modeling, association rules, clustering and logistic regression, the last criterion was the price and availability of the tool.
Keywords: Data mining; cloud; decision trees; regression analysis; cluster analysis; association rules

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 26. 11. 2021
Date of submission: 9. 5. 2022
Date of defense: 24. 6. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/80436/podrobnosti

Files for download

    Last update: