Analysis of Client and Product Base: Specifics of Retail Transaction Data
Thesis title: | Analysis of Client and Product Base: Specifics of Retail Transaction Data |
---|---|
Author: | Sokol, Ondřej |
Thesis type: | Dissertation thesis |
Supervisor: | Černý, Michal |
Opponents: | Kukal, Jaromír ; Šůcha, Přemysl |
Thesis language: | English |
Abstract: | Every retail transaction must be recorded. This means thousands to millions of transaction data rows per day for retail chains. Automatic processing of this data is crucial for the company's competitiveness. The importance of efficient processing using data driven methods -- which minimize the analyst's personal opinion in order to maximize automation -- is increasing. The proposed methods are based on the assumption that there is a large amount of data describing the purchase of a particular product, along with additional information such as baskets, links to a particular customer and his properties, and location and time of purchase.Based on this information, methods are proposed for (1) clustering the products into groups of mutual substitutes, (2) segmentation of customers based on their shopping mission, and (3) estimating the number of unique customers of a~retail chain.Methods are formulated as optimization problems. Their properties are verified by simulation studies, or compared with alternative approaches.All methods are applied to real data from a Czech retail chain.The results show that the presented methods are better or at least comparable with the common used methods. Their main advantage is a high degree of automation resulting in efficiency. The methods proposed are robust and allow to get additional new information that cannot be obtained by other methods. |
Keywords: | Customer Behavior; Cluster Analysis; Retail Business Analytics |
Thesis title: | Analýza klientské a produktové báze: Specifika maloobchodních transakčních dat |
---|---|
Author: | Sokol, Ondřej |
Thesis type: | Disertační práce |
Supervisor: | Černý, Michal |
Opponents: | Kukal, Jaromír ; Šůcha, Přemysl |
Thesis language: | English |
Abstract: | Každá transakce v maloobchodě musí být zaznamenána, což pro obchodní řetězce znamená tisíce až miliony řádků transakčních dat každý den. Automatické zpracování těchto dat je zásadní pro konkurenceschopnost firmy, a tak roste důležitost jejich efektivního zpracování pomocí tzv. data driven metod, při nichž se minimalizuje osobní přístup analytika ve prospěch maximální automatizace.Metody vycházejí z~předpokladu, že je k dispozici velké množství dat popisujících nákup konkrétního produktu spolu s doplňujícími informacemi, jako je uspořádání do košů, propojení s konkrétním klientem a jeho vlastnostmi či místo a čas provedení nákupu. Na základě těchto informací jsou navrženy metody pro (1) rozdělení produktů do skupin vzájemných substitutů, (2) segmentaci zákazníků na základě obvyklého důvodu nákupu a (3) odhad počtu unikátních zákazníků maloobchodního řetězce. Metody jsou formulovány jako optimalizační úlohy a jejich vlastnosti jsou ověřeny pomocí simulačních studií, případně jsou porovnány s alternativními přístupy. Všechny metody jsou aplikovány na reálná data z českého maloobchodního řetězce. Výsledky ukazují, že prezentované metody jsou lepší nebo alespoň konkurenceschopné v porovnání se standardně používanými metodami, přičemž jejich hlavní výhodou je vysoká míra automatizace, a tím i~efektivita. Metody jsou robustní a navíc umožňují získat dodatečné nové informace, které ostatními metodami získat nelze. |
Keywords: | shluková analýza; maloobchodní analýza dat; nákupní chování zákazníků |
Information about study
Study programme: | Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum |
---|---|
Type of study programme: | Doktorský studijní program |
Assigned degree: | Ph.D. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Econometrics |
Information on submission and defense
Date of assignment: | 23. 1. 2017 |
---|---|
Date of submission: | 18. 2. 2020 |
Date of defense: | 14. 5. 2020 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/72234/podrobnosti |