Analysis of real data of crowdfunding platform

Thesis title: Analýza reálnych dát crowdfundingovej platformy
Author: Vitko, Ondrej
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Berka, Petr
Thesis language: Slovensky
Abstract:
Bakalárska práca sa zameriava na objavovanie znalostí v databázach a jeho využitie na reálnych dátach. Cieľom je analyzovať dáta známej crowdfundingovej platformy Kickstarter a zistiť nové vzťahy a súvislosti. Analýza je vytvorená pomocou cloudového nástroju od firmy BigML. Proces objavovania znalostí v databázach prebieha podľa metodiky CRISP-DM. Práca je rozdelená na teoretickú a praktickú časť. V rámci teoretickej časti je čitateľovi predstavený obor objavovania znalostí v databázach, detailne je popísaná metodika CRISP-DM, predstavený je aj nástroj BigML a základné pojmy využívané v praktickej časti. Praktická časť začína zorientovaním sa v doménovej oblasti a definovaním analytických úloh. Nasleduje popis získania dát a spracovanie a úprava dát pomocou Excelu a nástroju BigML. Po úprave dát príde na rad podrobné modelovanie v grafickom prostredí BigML. Záver praktickej časti patrí reprezentácií zistených výsledkov z vytvorených modelov. Analýza sa opiera o klasifikačné a regresné modely, zhlukovanie a asociačné pravidlá. Prínosom práce je zo získaných dát zistiť zaujímavé vzťahy a súvislosti, ktoré by bolo možné použiť v praxi.
Keywords: BigML; CRISP-DM; Kickstarter; objavovanie znalostí v databázach; data mining
Thesis title: Analysis of real data of crowdfunding platform
Author: Vitko, Ondrej
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Berka, Petr
Thesis language: Slovensky
Abstract:
This bachelor thesis is focused on the datamining and its use on real data. The goal is to analyze the data of the well-known crowdfunding platform Kickstarter and find out new relationships and connections. The analysis is created using a cloud tool by BigML. The process of knowledge extraction is based on the CRISP-DM methodology. The thesis is divided into theoretical and practical part. In the theoretical part, the reader is introduced to the knowledge extraction, the CRISP-DM methodology is described in detail, the BigML tool and the basic terms used in the practical part are introduced. In the practical part, is firstly introduced the orientation in domain and defining of analytical tasks. It is followed by the description of data acquisition, its processing and editing using Excel and BigML. After data editing follows a series of detailed modelling in the BigML graphics environment. The conclusion of the practical part includes the representation of the results obtained from the created models. The analysis is based on classification and regression models, clustering and association rules. The benefit of the work is to find out interesting relationships and contexts that could be used in practice.
Keywords: BigML; CRISP-DM; data mining; Kickstarter; knowledge extraction
Thesis title: Analýza reálních dat crowdfundingové platformy
Author: Vitko, Ondrej
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Berka, Petr
Thesis language: Slovensky
Abstract:
Bakalářská práce zaměřující se na dobývání znalostí z databází a jeho využití na reálných datech. Cílem je zanalyzovat data známé crowdfundingové platformy Kickstarter a zjistit nové vztahy a souvislosti. Analýza je vytvořená pomocí cloudového nástroje od firmy BigML. Proces dobývání znalostí z databází probíhá podle metodiky CRISP-DM. Práce je rozdělená na teoretickou a praktickou část. V rámci teoretické části je čtenáři představený obor dobývání znalostí z databází, detailně popsaná metodika CRISP-DM, představený nástroj BigML a vyjasněny základní pojmy, které se nacházejí v praktické části. Praktická část začíná zorientováním se v doménové oblasti a definováním analytických úloh. Následuje popis získání dat, zpracování a úprava dat s pomocí programu Microsoft Excel a nástroje od firmy BigML. Po úpravě dat přijde na řadu obdobné modelování v grafickém prostředí BigML. Závěr praktické části patří reprezentaci zjištěných výsledků z vytvořených modelů. Analýza se opírá o klasifikační a regresivní modely, shlukování a asociační pravidla. Přínosem práce je získáním zajímavých vztahů a souvislostí nad vybranými daty, které by bylo možné využít v praxi.
Keywords: BigML; data mining; Kickstarter; dobývání znalostí z databází; CRISP-DM

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 31. 1. 2019
Date of submission: 5. 5. 2019
Date of defense: 11. 6. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/68466/podrobnosti

Files for download

    Last update: