Predikce času dokončení výdeje objednávek s využitím strojového učení

Název práce: Predikce času dokončení výdeje objednávek s využitím strojového učení
Autor(ka) práce: Klimplová, Veronika
Typ práce: Diplomová práce
Vedoucí práce: Berka, Petr
Oponenti práce: Jirsák, Petr
Jazyk práce: Česky
Abstrakt:
Práce se zabývá predikcí dokončení vychystání skladových objednávek z historických provozních dat. Hlavním cílem je vyvinout a otestovat predikční modely založené na metodách strojového učení, které na základě historických dat o výkonech skladového personálu a materiálových pohybech dokáží predikovat časy dokončení výdeje jednotlivých objednávek ze skladu. Návrh řešení postupuje dle metodiky CRISP-DM a zahrnuje čištění, transformaci a fúzi tří reálných datasetů, včetně tvorby nových odvozených proměnných a segmentace objednávek metodou K-means. Veškerá datová analytika a experimenty byly realizovány v jazyce Python s využitím interaktivního prostředí Jupyter Notebook. Následně proběhlo testování klasifikačních i regresních algoritmů strojového učení, z nichž jako nejvýkonnější vzešel model Random Forest. Regresní model dosáhl při šestinásobné křížové validaci průměrné absolutní odchylky (MAE) 3,06 hodiny (při R² = 0,78). U klasifikačního přístupu model predikoval zařazení do časových oken se správností (accuracy) 75,7 %. Z porovnání vyplynulo, že pro operativní řízení skladu a návaznost na dopravce je vhodnější optimalizovaný regresní přístup.
Klíčová slova: logistika; vychystávání; predikce; klasifikace; strojové učení; regrese; shlukování; Random Forest; Python; CRISP-DM
Název práce: Prediction of Order Picking Completion Time Using Machine Learning
Autor(ka) práce: Klimplová, Veronika
Typ práce: Diploma thesis
Vedoucí práce: Berka, Petr
Oponenti práce: Jirsák, Petr
Jazyk práce: Česky
Abstrakt:
This thesis deals with predicting the completion of warehouse order picking based on historical operational data. The main objective is to develop and test predictive models based on machine learning methods that can predict the completion times of individual order dispatches using historical data on warehouse staff performance and material movements. The proposed solution follows the CRISP-DM methodology and involves the cleaning, transformation, and merging of three real-world datasets, including the creation of new derived variables and the segmentation of orders using the K-means algorithm. All data analytics and experiments were conducted in the Python programming language using the interactive Jupyter Notebook environment. Subsequently, classification and regression machine learning algorithms were tested, with the Random Forest model emerging as the best performer. During a six-fold cross-validation, the regression model achieved a mean absolute error (MAE) of 3.06 hours (with R² = 0.78). In the classification approach, the model predicted the assignment of orders into time windows with an accuracy of 75.7 %. The comparison revealed that the optimized regression approach is more suitable for operational warehouse management and carrier coordination.
Klíčová slova: prediction; regression; CRISP-DM; logistics; order picking; classification; clustering; Random Forest; machine learning; Python

Informace o studiu

Studijní program / obor: Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 1. 12. 2025
Datum podání práce: 4. 5. 2026
Datum obhajoby: 1. 6. 2026
Identifikátor v systému InSIS: https://insis.vse.cz/zp/94743/podrobnosti

Soubory ke stažení

    Poslední aktualizace: