Analýza reálních dat crowdfundingové platformy

Název práce: Analýza reálnych dát crowdfundingovej platformy
Autor(ka) práce: Vitko, Ondrej
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Berka, Petr
Jazyk práce: Slovensky
Abstrakt:
Bakalárska práca sa zameriava na objavovanie znalostí v databázach a jeho využitie na reálnych dátach. Cieľom je analyzovať dáta známej crowdfundingovej platformy Kickstarter a zistiť nové vzťahy a súvislosti. Analýza je vytvorená pomocou cloudového nástroju od firmy BigML. Proces objavovania znalostí v databázach prebieha podľa metodiky CRISP-DM. Práca je rozdelená na teoretickú a praktickú časť. V rámci teoretickej časti je čitateľovi predstavený obor objavovania znalostí v databázach, detailne je popísaná metodika CRISP-DM, predstavený je aj nástroj BigML a základné pojmy využívané v praktickej časti. Praktická časť začína zorientovaním sa v doménovej oblasti a definovaním analytických úloh. Nasleduje popis získania dát a spracovanie a úprava dát pomocou Excelu a nástroju BigML. Po úprave dát príde na rad podrobné modelovanie v grafickom prostredí BigML. Záver praktickej časti patrí reprezentácií zistených výsledkov z vytvorených modelov. Analýza sa opiera o klasifikačné a regresné modely, zhlukovanie a asociačné pravidlá. Prínosom práce je zo získaných dát zistiť zaujímavé vzťahy a súvislosti, ktoré by bolo možné použiť v praxi.
Klíčová slova: BigML; CRISP-DM; Kickstarter; objavovanie znalostí v databázach; data mining
Název práce: Analysis of real data of crowdfunding platform
Autor(ka) práce: Vitko, Ondrej
Typ práce: Bachelor thesis
Vedoucí práce: Chudán, David
Oponenti práce: Berka, Petr
Jazyk práce: Slovensky
Abstrakt:
This bachelor thesis is focused on the datamining and its use on real data. The goal is to analyze the data of the well-known crowdfunding platform Kickstarter and find out new relationships and connections. The analysis is created using a cloud tool by BigML. The process of knowledge extraction is based on the CRISP-DM methodology. The thesis is divided into theoretical and practical part. In the theoretical part, the reader is introduced to the knowledge extraction, the CRISP-DM methodology is described in detail, the BigML tool and the basic terms used in the practical part are introduced. In the practical part, is firstly introduced the orientation in domain and defining of analytical tasks. It is followed by the description of data acquisition, its processing and editing using Excel and BigML. After data editing follows a series of detailed modelling in the BigML graphics environment. The conclusion of the practical part includes the representation of the results obtained from the created models. The analysis is based on classification and regression models, clustering and association rules. The benefit of the work is to find out interesting relationships and contexts that could be used in practice.
Klíčová slova: BigML; CRISP-DM; data mining; Kickstarter; knowledge extraction
Název práce: Analýza reálních dat crowdfundingové platformy
Autor(ka) práce: Vitko, Ondrej
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Berka, Petr
Jazyk práce: Slovensky
Abstrakt:
Bakalářská práce zaměřující se na dobývání znalostí z databází a jeho využití na reálných datech. Cílem je zanalyzovat data známé crowdfundingové platformy Kickstarter a zjistit nové vztahy a souvislosti. Analýza je vytvořená pomocí cloudového nástroje od firmy BigML. Proces dobývání znalostí z databází probíhá podle metodiky CRISP-DM. Práce je rozdělená na teoretickou a praktickou část. V rámci teoretické části je čtenáři představený obor dobývání znalostí z databází, detailně popsaná metodika CRISP-DM, představený nástroj BigML a vyjasněny základní pojmy, které se nacházejí v praktické části. Praktická část začíná zorientováním se v doménové oblasti a definováním analytických úloh. Následuje popis získání dat, zpracování a úprava dat s pomocí programu Microsoft Excel a nástroje od firmy BigML. Po úpravě dat přijde na řadu obdobné modelování v grafickém prostředí BigML. Závěr praktické části patří reprezentaci zjištěných výsledků z vytvořených modelů. Analýza se opírá o klasifikační a regresivní modely, shlukování a asociační pravidla. Přínosem práce je získáním zajímavých vztahů a souvislostí nad vybranými daty, které by bylo možné využít v praxi.
Klíčová slova: BigML; data mining; Kickstarter; dobývání znalostí z databází; CRISP-DM

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 31. 1. 2019
Datum podání práce: 5. 5. 2019
Datum obhajoby: 11. 6. 2019
Identifikátor v systému InSIS: https://insis.vse.cz/zp/68466/podrobnosti

Soubory ke stažení

    Poslední aktualizace: