Optimization of Shapley Value Estimation Methods for Marketing Attribution
Autor(ka) práce:
Vu, Van Hieu
Typ práce:
Diploma thesis
Vedoucí práce:
Zimmermann, Pavel
Oponenti práce:
Procházka, Jiří
Jazyk práce:
English
Abstrakt:
Marketing attribution remains a persistent challenge for e-commerce firms: companies invest across multiple channels but lack transparent methods for quantifying each channel’s contribution to conversions. Traditional rule-based models such as first-click or last-click attribution are simple and easy to interpret, yet they allocate credit according to fixed rules rather than actual marginal contribution and thus tend to oversimplify complex customer journeys. This thesis adopts the Shapley value from cooperative game theory as a fairer attribution mechanism, as it allocates conversion value to marketing channels based on their marginal contributions across all possible coalition orders. However, exact Shapley computation is computationally demanding because the number of coalitions grows significantly with the number of channels. To address this, three sampling-based estimators – antithetic Monte Carlo, stratified sampling and orthogonal spherical codes – are implemented and compared on session-level customer journeys constructed from Google Analytics 4 data for Vilgain s.r.o. Evaluation demonstrates that stratified sampling provides the greatest speed-up but suffers from large approximation errors, whereas antithetic and orthogonal sampling deliver much lower mean absolute error. Orthogonal sampling consistently offers the best balance between computational efficiency and accuracy, and the results suggest that a sample size of roughly 2,500–5,000 permutations provides the most suitable trade-off. Overall, the thesis shows that sampling-based Shapley estimation can make theoretically grounded attribution practically feasible for e-commerce marketing analytics.
Optimalizace metod odhadu Shapleyho hodnoty pro marketingovou atribuci
Autor(ka) práce:
Vu, Van Hieu
Typ práce:
Diplomová práce
Vedoucí práce:
Zimmermann, Pavel
Oponenti práce:
Procházka, Jiří
Jazyk práce:
English
Abstrakt:
Marketingová atribuce představuje dlouhodobou výzvu pro e-commerce společnosti, které investují do více marketingových kanálů, avšak postrádají transparentní metody pro kvantifikaci přínosu jednotlivých kanálů ke konverzím. Tradiční atribuční modely založené na pevných pravidlech, jako jsou first-touch nebo last-touch, jsou sice jednoduché a snadno interpretovatelné, ale přiřazují zásluhy podle předem definovaných pravidel namísto skutečného mezního přínosu jednotlivých kanálů, a proto mají tendenci zjednodušovat komplexní zákaznické cesty. Tato práce využívá Shapleyho hodnotu z kooperativní teorie her jako spravedlivější mechanismus marketingové atribuce, protože rozděluje hodnotu konverzí mezi marketingové kanály na základě jejich mezního přínosu ve všech možných pořadích koalic. Přesný výpočet Shapleyho hodnoty je však výpočetně náročný, jelikož počet koalic s rostoucím počtem kanálů výrazně narůstá. Za účelem překonání tohoto omezení jsou implementovány a porovnány tři vzorkovací odhady – antitetická metoda Monte Carlo, stratifikované vzorkování a metoda ortogonálních sférických kódů – na zákaznických cestách na úrovni relací sestavených z dat Google Analytics 4 společnosti Vilgain s.r.o. Výsledky ukazují, že stratifikované vzorkování dosahuje nejvyššího zrychlení výpočtu, avšak za cenu výrazně vyšší aproximační chyby, zatímco antitetická metoda a metoda ortogonálních sférických kódů vykazují podstatně nižší střední absolutní chybu. Metoda ortogonálních sférických kódů dlouhodobě poskytuje nejvyváženější kompromis mezi výpočetní efektivitou a přesností a výsledky naznačují, že velikost vzorku přibližně 2,500–5,000 permutací představuje nejvhodnější kompromis mezi těmito dvěma aspekty. Práce tak ukazuje, že vzorkovací odhad Shapleyho hodnoty umožňuje praktické využití teoreticky podložené marketingové atribuce v prostředí e-commerce analytiky.