Implementation of lifecycle management infrastructure for machine learning models

Název práce: Implementaction of lifecycle management infrastructure for machine learning models
Autor(ka) práce: Mírek, Albert
Typ práce: Diploma thesis
Vedoucí práce: Vencovský, Filip
Oponenti práce: Kučera, Jan
Jazyk práce: English
Abstrakt:
This thesis addresses the implementation of Machine Learning and Operations (MLOps) within a Czech e-commerce company by leveraging the existing Development and Operations (DevOps) infrastructure and the integration of additional open-source components. The primary objective was to bridge the gap between machine learning (ML) model development and its deployment, which is a common challenge in the production use of ML. By leveraging the principles of DevOps, this work extends these methods to include machine learning features, implementing automated lifecycle management infrastructure for ML models. The implementation involved the analysis and adaptation of MLOps components suitable for the company’s technical infrastructure and operational workflows. A sequence-aware ML recommender system was developed to validate the implemented MLOps infrastructure. This system served as a proof of concept but also demonstrated practical applications in enhancing the customer experience and business operations. The integrated MLOps infrastructure was evaluated by the Google maturity model, resulting in the validation of the automated ML model lifecycle management infrastructure. Although the whole range of MLOps characteristics, such as Continuous Training, was not realized due to the absence of the model in production use, the work sets a foundation and outlook for future enhancements. The contribution of this thesis is the adaptation of existing DevOps infrastructure to support the MLOps workflows without introducing unnecessary complexity. This may serve as a starting point for other companies aiming to integrate MLOps. The implemented system poses limitations in direct transferability due to the tailored solution for the company context, but it provides a structured way for similar implementations. Future work will focus on the implementation of Continuous Training and more granular execution of the pipeline to enhance efficiency, reduce computational costs, and acceleration of deployment.
Klíčová slova: ml lifecycle management; mlops; ml; devops
Název práce: Implementation of lifecycle management infrastructure for machine learning models
Autor(ka) práce: Mírek, Albert
Typ práce: Diplomová práce
Vedoucí práce: Vencovský, Filip
Oponenti práce: Kučera, Jan
Jazyk práce: English
Abstrakt:
Tato práce se zabývá implementací strojového učení a provozu (MLOps) v rámci české e-commerce společnosti s využitím stávající infrastruktury pro vývoj a provoz (DevOps) a integrací dalších open-source komponent. Hlavním cílem práce bylo překlenout mezeru mezi vývojem modelu strojového učení (ML) a jeho nasazením, což je častý problém při produkčním využití ML. S využitím principů DevOps tato práce tato práce rozšiřuje tyto metody o funkce strojového učení a zavádí infrastrukturu pro automatizovanou správu životního cyklu modelů strojového učení. Implementace zahrnovala analýzy a přizpůsobení komponent MLOps vhodných pro technickou infrastrukturu a provozní pracovní postupy společnosti. K ověření implementované infrastruktury MLOps byl vyvinut doporučovací systém na bází strojového učení. Tento systém sloužil jako proof of concept, ale také demonstroval praktické využití při zlepšování zákaznické zkušenosti a obchodních operací. Integrovaná infrastruktura MLOps byla vyhodnocena podle modelu zralosti společnosti Google, což vedlo k validaci automatizované infrastruktury pro správu životního cyklu modelů strojového učení. Přestože nebylo realizováno plný rozsah charakteristik MLOps, jako je například kontinuální trénování a to z důvodu absence modelu v produkčním provozu, práce vytváří základ a výhled pro budoucí vylepšení. Přínosem této práce je přizpůsobení stávající DevOps infrastruktury pro podporu pracovních postupů MLOps bez zavádění nových komplexit. To může sloužit jako výchozí bod pro ostatní společnosti usilující o zavedení MLOps. Implementovaný systém představuje omezení v přímé přenositelnosti kvůli řešení šitému na míru dané společnosti, ale poskytuje strukturovaný způsobe pro podobné implementace. Budoucí práce se zaměří na implementace kontinuálního trénování a granulárnějšího provádění operací s cílem zvýšení efektivity, snížení nákladů a urychlení nasazení.
Klíčová slova: ml; devops; mlops; ml lifecycle management

Informace o studiu

Studijní program / obor: Informační systémy a technologie/Vývoj informačních systémů
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 23. 10. 2023
Datum podání práce: 29. 4. 2024
Datum obhajoby: 5. 6. 2024
Identifikátor v systému InSIS: https://insis.vse.cz/zp/87195/podrobnosti

Soubory ke stažení

    Poslední aktualizace: