Využití statistických metod v data miningu při predikci chování zákazníků internetového obchodu
Název práce: | Využití statistických metod v data miningu při predikci chování zákazníků internetového obchodu |
---|---|
Autor(ka) práce: | Podzimková, Michaela |
Typ práce: | Diplomová práce |
Vedoucí práce: | Vilikus, Ondřej |
Oponenti práce: | Berka, Petr |
Jazyk práce: | Česky |
Abstrakt: | Data mining je nová disciplína, která se objevuje s rostoucím množstvím ukládaných dat a s rostoucí potřebou získat informace v nich ukryté. Zabývá se extrahováním potenciálně užitečných informací z velkých datových souborů a leží na pomezí statistiky, strojového učení, umělé inteligence, databází a dalších oborů. Cílem této diplomové práce je představit celý proces data miningu s důrazem na jeho spojitost se statistikou a popsat vybrané statistické metody, které se v této oblasti hodně používají a které jsou v práci aplikovány na vlastní řešení dataminingového problému. Na reálných datech o nákupech v internetovém obchodě je ukázáno, že využití různých metod přináší různé výsledky a zajímavé poznatky o nákupním chování, a také vede k dokázání, že ne všechny metody jsou vždy použitelné na všechny typy úloh. |
Klíčová slova: | rozhodovací stromy; shluková analýza; vzory; dolování; data mining; logistická regrese |
Název práce: | The use of statistical methods in data mining in predicting consumer behaviour for Internet purchases |
---|---|
Autor(ka) práce: | Podzimková, Michaela |
Typ práce: | Diploma thesis |
Vedoucí práce: | Vilikus, Ondřej |
Oponenti práce: | Berka, Petr |
Jazyk práce: | Česky |
Abstrakt: | Data mining is a new discipline that occurs with increasing amount of stored data and the increasing need to obtain the information hidden in them. It is focused on the mining of potentially useful information from large data sets and it lies at the intersection of statistics, machine learning, artificial intelligence, databases and other areas. The aim of this thesis is to present the process of data mining with an emphasis on its connection with statistics and to describe a selection of statistical methods widely used in this field and which were also used in the applied data mining problem in this thesis. Real data from purchases in the online store show that using different methods gives different results and interesting information about purchasing behavior, and also proves that not all methods are always applicable to all types of tasks. |
Klíčová slova: | cluster analysis; data mining; logistic regression; decision trees; patterns |
Informace o studiu
Studijní program / obor: | Kvantitativní metody v ekonomice/Statisticko-pojistné inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 9. 1. 2015 |
---|---|
Datum podání práce: | 13. 5. 2015 |
Datum obhajoby: | 9. 6. 2015 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/50813/podrobnosti |