Srovnání klasických a cloudových přístupů k data miningu

Název práce: Srovnání klasických a cloudových přístupů k data miningu
Autor(ka) práce: Eliášek, Milan
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Strnad, Pavel
Jazyk práce: Česky
Abstrakt:
Tato práce se zabývá srovnáním klasických on-premise nástrojů pro data mining, v práci zastoupeny nástrojem Orange, a cloudový nástrojů, zastoupeny nástrojem BigML. V úvodu jsou definovány pojmy dolování znalostí z databází a data mining. Následně jsou popsány vybraná kritéria. Poté je provedeno samotné srovnání. Porovnání je provedeno na základě vícekriteriálního hodnocení obou zvolených nástrojů. Konkrétně jejich možnosti nastavení a výstupy pro nahrání a předzpracování dat, tvorbou klasifikačních modelů, které jsou reprezentovány rozhodovacími stromy a logistickou regresí; hledání asociačních pravidel a shlukování, jako poslední kritérium byla vybrána cena a dostupnost nástroje.
Klíčová slova: cloud; rozhodovací stromy; regresní analýza; shluková analýza; asociační pravidla; Data mining
Název práce: Comparison of classic and cloud approaches to data mining
Autor(ka) práce: Eliášek, Milan
Typ práce: Bachelor thesis
Vedoucí práce: Chudán, David
Oponenti práce: Strnad, Pavel
Jazyk práce: Česky
Abstrakt:
This work deals with the comparison of classic on-premise tools for data mining, represented in the work by the Orange tool, and cloud tools, represented by the BigML tool. The introduction defines the concepts of knowledge mining from databases and data mining. Subsequently, selected criteria are described. Then the comparison itself is performed. The comparison is made on the basis of a multi-criteria evaluation of both selected tools. Specifically, their setting options and outputs for data upload and preprocessing, decision tree modeling, association rules, clustering and logistic regression, the last criterion was the price and availability of the tool.
Klíčová slova: Data mining; cloud; decision trees; regression analysis; cluster analysis; association rules

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 26. 11. 2021
Datum podání práce: 9. 5. 2022
Datum obhajoby: 24. 6. 2022
Identifikátor v systému InSIS: https://insis.vse.cz/zp/80436/podrobnosti

Soubory ke stažení

    Poslední aktualizace: