Application of Advanced Data Analytics within an E-commerce Company's Environment
Thesis title: | Aplikace pokročilé datové analytiky v prostředí e–commerce společnosti |
---|---|
Author: | Novotný, Pavel |
Thesis type: | Diplomová práce |
Supervisor: | Novotný, Ota |
Opponents: | Zimmermann, Pavel |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá pokročilou datovou analytikou v e-commerce oblasti. V dnešní době mají e-commerce společnosti k dispozici velké množství dat z různých datových zdrojů s potenciálem využít tato data pro svou konkurenční výhodu. Cílem této práce je tedy vytvořit doporučovací systém pro cross-selling pomocí item-based collaborative filtering metody, s využitím dat od konkrétní e-commerce společnosti. Tento model by pak mohl být následně nasazen v produkčním prostředí dané společnosti. V první fázi je provedena shluková analýza na základě RFM segmentačních proměnných pomocí metody k-means pro k = 5. Následně je jednotlivě na získaných segmentech aplikován doporučovací systém. Doporučení jsou generována na úrovni produktových kategorií, přičemž v rámci každé doporučené kategorie je jako finální výstup systému zvolen její nejprodávanější produkt. Počet top-N doporučení lze zvolit jako parametr. Dle výsledků evaluace u 45,4 % zákazníků z validační skupiny byla doporučena alespoň 1 kategorie správně. S ohledem na řídkost dat matice uživatelů a položek by mohl být proveden další výzkum za účelem optimalizace dalších pravidel mapování produktů k doporučeným kategoriím vedle použitých nejprodávanějších produktů, aby se minimalizoval pozorovaný long tail efekt. |
Keywords: | pokročilá datová analytika; cross sell; item-based collaborative filtering; shluková analýza; e-commerce; doporučovací systém |
Thesis title: | Application of Advanced Data Analytics within an E-commerce Company's Environment |
---|---|
Author: | Novotný, Pavel |
Thesis type: | Diploma thesis |
Supervisor: | Novotný, Ota |
Opponents: | Zimmermann, Pavel |
Thesis language: | Česky |
Abstract: | This master thesis deals with advanced data analytics in e-commerce business. Nowadays, e-commerce companies possess large amount of data from a variety of data sources with the potential to leverage that data for their competitive advantage. Thus, the objective of this paper is to build a recommender system model for cross-selling using item-based collaborative filtering approach utilizing data from a specific e-commerce company that could be deployed in production afterwards. In the first stage, cluster analysis of customer RFM segmentation variables is performed using the k-means method with k = 5. Subsequently, the item-based collaborative filtering RS is applied on each of the obtained clusters separately. The recom- mendations are generated on the product category level, with each category being mapped to its best-selling product as the final output of the recommender system. The number of top-N recommendations can be chosen as a parameter. The evaluation yields a result that 45.4 % of customers of validation set being correctly recommended at least 1 category. Considering the data sparsity of the user-item matrix, further research and model development might be conducted to optimize the mapping rule of products to the recommended categories alongside best-selling products to minimize the observed long tail effect. |
Keywords: | recommender system; item-based collaborative filtering; advanced analytics; cross sell; cluster analysis; e-commerce |
Information about study
Study programme: | Informační systémy a technologie/Business Intelligence |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 28. 10. 2021 |
---|---|
Date of submission: | 2. 5. 2022 |
Date of defense: | 9. 6. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/78568/podrobnosti |