Product data quality excellence platform with predictive machine learning module for quality data control and automation in FMCG

Thesis title: Product data quality excellence platform with predictive machine learning module for quality data control and automation in FMCG
Author: Kellermann Slotemaker, Petra
Thesis type: Závěrečná práce - Institut celoživotního vzdělávání
Supervisor: Potančok, Martin
Opponents: Matějka, Martin
Thesis language: English
Abstract:
The aim of this thesis is to develop and implement the Product Data Quality Excellence (DQX) platform, designed to address critical needs in Nestlé CEE's product data management by revising current processes, enhancing data quality transparency, and reducing manual workload through automation of data quality control process, and ultimately achieving long-term improvement in product data quality. The research employs both secondary and primary methodologies. Secondary research involves a thorough review of existing literature, while primary research includes data analysis and iterative feedback from users. The project leverages Product DQX platform based on various programming skills and software tools, including Python, SQL, Microsoft Power BI and predictive models based on neural networks, anomaly detection, or natural language processing (NLP). The developed Product DQX platform integrates data management, ETL modules, data quality dashboards, and predictive machine learning techniques. The project achieved its objectives, by recommending several changes in data management, providing much needed transparency by data quality dashboard linked to the key KPIs and data stewards, providing insights for further data quality improvements as well as integrating automated data quality control for key attributes. The Product DQX platform provides a comprehensive, cost-effective solution for product data management matching company maturity and needs, offering tool with direct impact on data quality KPIs. Provided prototype is paving the way for further robust deployment.
Keywords: Product Data Quality; Product Data Quality Excellence Platform; Predictive Machine Learning; Data Quality KPIs; Data Management; Neural Networks; Anomaly Detection; Natural Language Processing (NLP); Data Quality Dashboards; Data Quality Transparency; Data Quality Monitoring; Data Quality in FMCG; Python Programming; Data Governance; Data Quality Automation
Thesis title: Product data quality excellence platform with predictive machine learning module for quality data control and automation in FMCG
Author: Kellermann Slotemaker, Petra
Thesis type: Závěrečná práce - Institut celoživotního vzdělávání
Supervisor: Potančok, Martin
Opponents: Matějka, Martin
Thesis language: English
Abstract:
Platforma pro zlepšování kvality produktových dat v oblasti rychloobrátkového zboží s modulem prediktivního strojového učení pro kontrolu a automatizaci kvality dat. Cílem této diplomové práce je vyvinout a implementovat Product Data Quality Excellence (DQX) Platformu, která má řešit kritické potřeby v oblasti správy dat o výrobcích společnosti Nestlé CEE revizí stávajících procesů, zvýšením transparentnosti kvality dat a snížením manuální zátěže prostřednictvím automatizace procesu kontroly kvality dat, a tím v konečném důsledku dosáhnout dlouhodobého zlepšení kvality produktových dat. Výzkum využívá jak sekundární, tak primární metodiky. Sekundární výzkum zahrnuje důkladný přehled existující literatury, zatímco primární výzkum zahrnuje analýzu dat a opakovanou zpětnou vazbu od uživatelů. Projekt doručil platformu Product DQX založenou na různých programátorských dovednostech a softwarových nástrojích, včetně jazyků Python a SQL, platofrmy Microsoft Power BI a prediktivních modelů založených na neuronových sítích, detekci anomálií nebo zpracování přirozeného jazyka (NLP). Vyvinutá platforma Product DQX integruje data management, ETL, dashboard kvality dat a prediktivní techniky strojového učení. Projekt dosáhl svých cílů tím, že doporučil několik změn ve správě dat, poskytl tolik potřebnou transparentnost dat prostřednictvím dashboardu kvality dat propojeného s klíčovými ukazateli (KPIs) a správci dat, poskytl poznatky pro další zlepšování kvality dat na základě četných analýz a také integroval automatizovanou kontrolu kvality dat pro klíčové atributy. Platforma Product DQX poskytuje komplexní, nákladově efektivní řešení pro správu produktových dat odpovídající zralosti a potřebám společnosti, nabízející nástroj s přímým dopadem na klíčové ukazatele kvality dat. Poskytnutý prototyp připravuje půdu pro další robustní nasazení.
Keywords: KPI kvality dat; Kvalita dat v oblasti rychloobrátkového zboží; Zpracování přirozeného jazyka (NLP); Dashboard kvality dat; Transparentnost kvality dat; Monitorování kvality dat; Automatizace kvality dat; Kvalita produktových dat; Kvalita kmenových dat; Platforma pro zlepšování kvality produktových dat; Prediktivní strojové učení; Programování v Pythonu; Správa dat; Neuronové sítě; Detekce anomálií

Information about study

Study programme: Data & Analytics for Business Management
Type of study programme: Celoživotní vzdělávání studijní program
Assigned degree: MBA
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 22. 3. 2024
Date of submission: 14. 12. 2024
Date of defense: 28. 2. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/90687/podrobnosti

Files for download

    Last update: