Comparison of classic and cloud approaches to data mining
Thesis title: | Srovnání klasických a cloudových přístupů k data miningu |
---|---|
Author: | Eliášek, Milan |
Thesis type: | Bakalářská práce |
Supervisor: | Chudán, David |
Opponents: | Strnad, Pavel |
Thesis language: | Česky |
Abstract: | Tato práce se zabývá srovnáním klasických on-premise nástrojů pro data mining, v práci zastoupeny nástrojem Orange, a cloudový nástrojů, zastoupeny nástrojem BigML. V úvodu jsou definovány pojmy dolování znalostí z databází a data mining. Následně jsou popsány vybraná kritéria. Poté je provedeno samotné srovnání. Porovnání je provedeno na základě vícekriteriálního hodnocení obou zvolených nástrojů. Konkrétně jejich možnosti nastavení a výstupy pro nahrání a předzpracování dat, tvorbou klasifikačních modelů, které jsou reprezentovány rozhodovacími stromy a logistickou regresí; hledání asociačních pravidel a shlukování, jako poslední kritérium byla vybrána cena a dostupnost nástroje. |
Keywords: | cloud; rozhodovací stromy; regresní analýza; shluková analýza; asociační pravidla; Data mining |
Thesis title: | Comparison of classic and cloud approaches to data mining |
---|---|
Author: | Eliášek, Milan |
Thesis type: | Bachelor thesis |
Supervisor: | Chudán, David |
Opponents: | Strnad, Pavel |
Thesis language: | Česky |
Abstract: | This work deals with the comparison of classic on-premise tools for data mining, represented in the work by the Orange tool, and cloud tools, represented by the BigML tool. The introduction defines the concepts of knowledge mining from databases and data mining. Subsequently, selected criteria are described. Then the comparison itself is performed. The comparison is made on the basis of a multi-criteria evaluation of both selected tools. Specifically, their setting options and outputs for data upload and preprocessing, decision tree modeling, association rules, clustering and logistic regression, the last criterion was the price and availability of the tool. |
Keywords: | Data mining; cloud; decision trees; regression analysis; cluster analysis; association rules |
Information about study
Study programme: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 26. 11. 2021 |
---|---|
Date of submission: | 9. 5. 2022 |
Date of defense: | 24. 6. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/80436/podrobnosti |