Application of Advanced Data Analytics within an E-commerce Company's Environment

Thesis title: Aplikace pokročilé datové analytiky v prostředí e–commerce společnosti
Author: Novotný, Pavel
Thesis type: Diplomová práce
Supervisor: Novotný, Ota
Opponents: Zimmermann, Pavel
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá pokročilou datovou analytikou v e-commerce oblasti. V dnešní době mají e-commerce společnosti k dispozici velké množství dat z různých datových zdrojů s potenciálem využít tato data pro svou konkurenční výhodu. Cílem této práce je tedy vytvořit doporučovací systém pro cross-selling pomocí item-based collaborative filtering metody, s využitím dat od konkrétní e-commerce společnosti. Tento model by pak mohl být následně nasazen v produkčním prostředí dané společnosti. V první fázi je provedena shluková analýza na základě RFM segmentačních proměnných pomocí metody k-means pro k = 5. Následně je jednotlivě na získaných segmentech aplikován doporučovací systém. Doporučení jsou generována na úrovni produktových kategorií, přičemž v rámci každé doporučené kategorie je jako finální výstup systému zvolen její nejprodávanější produkt. Počet top-N doporučení lze zvolit jako parametr. Dle výsledků evaluace u 45,4 % zákazníků z validační skupiny byla doporučena alespoň 1 kategorie správně. S ohledem na řídkost dat matice uživatelů a položek by mohl být proveden další výzkum za účelem optimalizace dalších pravidel mapování produktů k doporučeným kategoriím vedle použitých nejprodávanějších produktů, aby se minimalizoval pozorovaný long tail efekt.
Keywords: pokročilá datová analytika; cross sell; item-based collaborative filtering; shluková analýza; e-commerce; doporučovací systém
Thesis title: Application of Advanced Data Analytics within an E-commerce Company's Environment
Author: Novotný, Pavel
Thesis type: Diploma thesis
Supervisor: Novotný, Ota
Opponents: Zimmermann, Pavel
Thesis language: Česky
Abstract:
This master thesis deals with advanced data analytics in e-commerce business. Nowadays, e-commerce companies possess large amount of data from a variety of data sources with the potential to leverage that data for their competitive advantage. Thus, the objective of this paper is to build a recommender system model for cross-selling using item-based collaborative filtering approach utilizing data from a specific e-commerce company that could be deployed in production afterwards. In the first stage, cluster analysis of customer RFM segmentation variables is performed using the k-means method with k = 5. Subsequently, the item-based collaborative filtering RS is applied on each of the obtained clusters separately. The recom- mendations are generated on the product category level, with each category being mapped to its best-selling product as the final output of the recommender system. The number of top-N recommendations can be chosen as a parameter. The evaluation yields a result that 45.4 % of customers of validation set being correctly recommended at least 1 category. Considering the data sparsity of the user-item matrix, further research and model development might be conducted to optimize the mapping rule of products to the recommended categories alongside best-selling products to minimize the observed long tail effect.
Keywords: recommender system; item-based collaborative filtering; advanced analytics; cross sell; cluster analysis; e-commerce

Information about study

Study programme: Informační systémy a technologie/Business Intelligence
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 28. 10. 2021
Date of submission: 2. 5. 2022
Date of defense: 9. 6. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/78568/podrobnosti

Files for download

    Last update: