Development of Predictive Models to Optimize Order Forecasting in a Technology Company

Thesis title: Vývoj prediktivních modelů pro optimalizaci předpovědi objednávek v technologické společnosti
Author: Nová, Michaela
Thesis type: Diplomová práce
Supervisor: Kovářová, Marie
Opponents: Maryška, Miloš
Thesis language: Česky
Abstract:
Tato diplomová práce se zaměřuje na tvorbu prediktivního modelu pro předpověď objednávek s využitím metod pro zpracování časových řad. Cílem bylo automaticky předpřipravit data pro datově odlišné soubory zákazníků a nalézt takový model, který by dokázal vhodně predikovat a vystihnout odlišnosti mezi těmito soubory. Vývoj modelu vycházel z metodologie CRISP-DM, která strukturovala jednotlivé kroky od porozumění byznysu až po nasazení. V rámci teoretické části byly představeny jednotlivé přístupy pro modelaci časových řad, které byly následně využity v části praktické. Klíčovým krokem pro vývoj modelu bylo předzpracování dat, v jehož rámci byla data logaritmována, vyhlazena exponenciálně a pomocí klouzavých průměrů, a dále připravena pomocí pipelines. Jelikož se v datech vyskytovaly výrazné fluktuace, byly nejlepších výsledků dosaženo pomocí exponenciálního vyhlazení s většími okny. Nejnižší chyby na validační sadě dosáhl model XGBRegressor, jehož hyperparametry byly laděny pomocí Grid search z důvodu časových omezení a paralelního zpracování, které tento algoritmus umožňuje. Výsledky ukázaly, že klíčovým krokem pro přesnost predikcí byla zejména agregace dat na měsíční úroveň a následné předzpracování dat. Model XGBRegressor je v současnosti ve fázi testování, aby byla ověřena jeho stabilita a spolehlivost v praxi.
Keywords: Prediktivní modelování; objednávky; XGBRegressor; vyhlazení; časové řady
Thesis title: Development of Predictive Models to Optimize Order Forecasting in a Technology Company
Author: Nová, Michaela
Thesis type: Diploma thesis
Supervisor: Kovářová, Marie
Opponents: Maryška, Miloš
Thesis language: Česky
Abstract:
This thesis focuses on the development of a predictive model for orders by applying methods for time series analysis. The objective was to automatically preprocess data for data- differentiated customer groups and find a model which could appropriately capture differences among customers. Development of the predictive model was based on the CRISP-DM methodology, which provided structure from business understanding to deployment. Within the theoretical section, the individual approaches for time series prediction were presented and later applied in the practical section. The key step for the development of the predictive model was preprocessing of data. As part of the preprocessing, data were logarithmically transformed, exponentially smoothed, smoothed using moving averages, and then prepared with pipelines. Since the data exhibited significant fluctuations, the best results were obtained with exponential smoothing using wider windows. The algorithm XGBRegressor was selected based on the minimum error on the validation data and was fine-tuned with Grid search, due to time constraints and the parallel processing capabilities it provides. Based on the results, the key steps were data aggregation at the monthly level and preprocessing of the target and features. The XGBRegressor model is currently being tested to verify its stability and reliability in a real environment.
Keywords: smoothing; Predictive modeling; orders; XGBRegressor; time series

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 2. 1. 2025
Date of submission: 25. 6. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: