Srovnání klasických a cloudových přístupů k data miningu
Název práce: | Srovnání klasických a cloudových přístupů k data miningu |
---|---|
Autor(ka) práce: | Eliášek, Milan |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Strnad, Pavel |
Jazyk práce: | Česky |
Abstrakt: | Tato práce se zabývá srovnáním klasických on-premise nástrojů pro data mining, v práci zastoupeny nástrojem Orange, a cloudový nástrojů, zastoupeny nástrojem BigML. V úvodu jsou definovány pojmy dolování znalostí z databází a data mining. Následně jsou popsány vybraná kritéria. Poté je provedeno samotné srovnání. Porovnání je provedeno na základě vícekriteriálního hodnocení obou zvolených nástrojů. Konkrétně jejich možnosti nastavení a výstupy pro nahrání a předzpracování dat, tvorbou klasifikačních modelů, které jsou reprezentovány rozhodovacími stromy a logistickou regresí; hledání asociačních pravidel a shlukování, jako poslední kritérium byla vybrána cena a dostupnost nástroje. |
Klíčová slova: | cloud; rozhodovací stromy; regresní analýza; shluková analýza; asociační pravidla; Data mining |
Název práce: | Comparison of classic and cloud approaches to data mining |
---|---|
Autor(ka) práce: | Eliášek, Milan |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Strnad, Pavel |
Jazyk práce: | Česky |
Abstrakt: | This work deals with the comparison of classic on-premise tools for data mining, represented in the work by the Orange tool, and cloud tools, represented by the BigML tool. The introduction defines the concepts of knowledge mining from databases and data mining. Subsequently, selected criteria are described. Then the comparison itself is performed. The comparison is made on the basis of a multi-criteria evaluation of both selected tools. Specifically, their setting options and outputs for data upload and preprocessing, decision tree modeling, association rules, clustering and logistic regression, the last criterion was the price and availability of the tool. |
Klíčová slova: | Data mining; cloud; decision trees; regression analysis; cluster analysis; association rules |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 26. 11. 2021 |
---|---|
Datum podání práce: | 9. 5. 2022 |
Datum obhajoby: | 24. 6. 2022 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/80436/podrobnosti |