Aplikace pokročilé datové analytiky v prostředí e–commerce společnosti

Název práce: Aplikace pokročilé datové analytiky v prostředí e–commerce společnosti
Autor(ka) práce: Novotný, Pavel
Typ práce: Diplomová práce
Vedoucí práce: Novotný, Ota
Oponenti práce: Zimmermann, Pavel
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá pokročilou datovou analytikou v e-commerce oblasti. V dnešní době mají e-commerce společnosti k dispozici velké množství dat z různých datových zdrojů s potenciálem využít tato data pro svou konkurenční výhodu. Cílem této práce je tedy vytvořit doporučovací systém pro cross-selling pomocí item-based collaborative filtering metody, s využitím dat od konkrétní e-commerce společnosti. Tento model by pak mohl být následně nasazen v produkčním prostředí dané společnosti. V první fázi je provedena shluková analýza na základě RFM segmentačních proměnných pomocí metody k-means pro k = 5. Následně je jednotlivě na získaných segmentech aplikován doporučovací systém. Doporučení jsou generována na úrovni produktových kategorií, přičemž v rámci každé doporučené kategorie je jako finální výstup systému zvolen její nejprodávanější produkt. Počet top-N doporučení lze zvolit jako parametr. Dle výsledků evaluace u 45,4 % zákazníků z validační skupiny byla doporučena alespoň 1 kategorie správně. S ohledem na řídkost dat matice uživatelů a položek by mohl být proveden další výzkum za účelem optimalizace dalších pravidel mapování produktů k doporučeným kategoriím vedle použitých nejprodávanějších produktů, aby se minimalizoval pozorovaný long tail efekt.
Klíčová slova: pokročilá datová analytika; cross sell; item-based collaborative filtering; shluková analýza; e-commerce; doporučovací systém
Název práce: Application of Advanced Data Analytics within an E-commerce Company's Environment
Autor(ka) práce: Novotný, Pavel
Typ práce: Diploma thesis
Vedoucí práce: Novotný, Ota
Oponenti práce: Zimmermann, Pavel
Jazyk práce: Česky
Abstrakt:
This master thesis deals with advanced data analytics in e-commerce business. Nowadays, e-commerce companies possess large amount of data from a variety of data sources with the potential to leverage that data for their competitive advantage. Thus, the objective of this paper is to build a recommender system model for cross-selling using item-based collaborative filtering approach utilizing data from a specific e-commerce company that could be deployed in production afterwards. In the first stage, cluster analysis of customer RFM segmentation variables is performed using the k-means method with k = 5. Subsequently, the item-based collaborative filtering RS is applied on each of the obtained clusters separately. The recom- mendations are generated on the product category level, with each category being mapped to its best-selling product as the final output of the recommender system. The number of top-N recommendations can be chosen as a parameter. The evaluation yields a result that 45.4 % of customers of validation set being correctly recommended at least 1 category. Considering the data sparsity of the user-item matrix, further research and model development might be conducted to optimize the mapping rule of products to the recommended categories alongside best-selling products to minimize the observed long tail effect.
Klíčová slova: recommender system; item-based collaborative filtering; advanced analytics; cross sell; cluster analysis; e-commerce

Informace o studiu

Studijní program / obor: Informační systémy a technologie/Business Intelligence
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 28. 10. 2021
Datum podání práce: 2. 5. 2022
Datum obhajoby: 9. 6. 2022
Identifikátor v systému InSIS: https://insis.vse.cz/zp/78568/podrobnosti

Soubory ke stažení

    Poslední aktualizace: