Návrh a implementace MLOps infrastruktury na Fakultě informatiky a statistiky
| Název práce: | Návrh a implementace MLOps infrastruktury na Fakultě informatiky a statistiky |
|---|---|
| Autor(ka) práce: | Mrhálek, Filip |
| Typ práce: | Diplomová práce |
| Vedoucí práce: | Vencovský, Filip |
| Oponenti práce: | Šimeček, Karel |
| Jazyk práce: | Česky |
| Abstrakt: | Tato diplomová práce se zabývá návrhem a implementací MLOps infrastruktury pro Fakultu informatiky a statistiky Vysoké školy ekonomické v Praze. Motivací je mezera v adopci MLOps praktik v akademickém prostředí identifikovaná v recenzované literatuře a konkrétní provozní potřeby fakulty disponující různorodým portfoliem GPU karet bez systematické izolace zdrojů a bez observability. Práce přistupuje k tématu metodikou Design Science Research a je strukturována do pěti dílčích cílů. Syntézy recenzované literatury, analýzy stávajícího stavu na základě polostrukturovaných rozhovorů se čtyřmi pedagogy, návrhu architektury, implementace ve validačním prostředí Microsoft Azure a hodnocení proti rámci zralosti Johna, Olssona a Bosche (2021, 2025) a katalogu Recupita et al. (2022). Implementovaná platforma je postavena výhradně na otevřených komponentách. Jádrem je MLflow Tracking a Model Registry, Ollama s LiteLLM jako LLM inference vrstva, Caddy s TLS přes Let's Encrypt, JupyterHub s DockerSpawnerem a monitorovací stack Prometheus s Grafanou a dcgm-exporterem. Infrastruktura je deklarativně spravována přes Ansible a Terraform. Hodnocení ukazuje dvoustupňový profil zralosti. V implementovaných komponentách platforma dosahuje stupně 2 podle primárního rámce, v komponentách ponechaných ve fázi návrhu (verzování dat, automatizovaná tréninková pipeline) zůstává na stupni 0. Oba problémy formulované v analýze stávajícího stavu byly adresovány. Absence izolace GPU byla empiricky vyřešena pro softwarovou cestu a designově připravena pro hardwarovou cestu s MIG, omezená viditelnost do provozu byla vyřešena observability nástroji. |
| Klíčová slova: | MLOps; JupyterHub; MLflow; kontejnerizace; akademická infrastruktura; sdílení GPU; Docker Compose; Ansible; Terraform |
| Název práce: | Design and Implementation of an MLOps Infrastructure at the Faculty of Informatics and Statistics |
|---|---|
| Autor(ka) práce: | Mrhálek, Filip |
| Typ práce: | Diploma thesis |
| Vedoucí práce: | Vencovský, Filip |
| Oponenti práce: | Šimeček, Karel |
| Jazyk práce: | Česky |
| Abstrakt: | This thesis addresses the design and implementation of an MLOps infrastructure for the Faculty of Informatics and Statistics at the University of Economics, Prague. The motivation stems from a gap in the adoption of MLOps practices in the academic environment, as identified in the peer-reviewed literature, and from the specific operational needs of the faculty, which possesses a diverse portfolio of GPU cards without systematic resource isolation or observability. The thesis approaches the topic using the Design Science Research methodology and is structured into five sub-objectives: a synthesis of the peer-reviewed literature, an analysis of the current state based on semi-structured interviews with four faculty members, architecture design, implementation in a Microsoft Azure validation environment, and evaluation against the maturity framework by John, Olsson and Bosch (2021, 2025) and the catalog by Recupita et al. (2022). The implemented platform is built exclusively on open-source components. At its core are MLflow Tracking and Model Registry, Ollama with LiteLLM as the LLM inference layer, Caddy with TLS via Let’s Encrypt, JupyterHub with DockerSpawner, and the Prometheus monitoring stack with Grafana and dcgm-exporter. The infrastructure is declaratively managed via Ansible and Terraform. The assessment reveals a bimodal maturity profile. In the implemented components, the platform achieves Level 2 according to the primary framework, while in the components still in the design phase (data versioning, automated training pipeline), it remains at Level 0. Both issues identified in the analysis of the current state have been addressed—the lack of GPU isolation has been empirically resolved for the software path and designed for the hardware path with MIG, and limited operational visibility has been resolved with an observability stack. According to available sources, this work represents the first systematically documented MLOps implementation in the Czech higher education environment. |
| Klíčová slova: | MLOps; MLflow; JupyterHub; GPU sharing; containerization; academic infrastructure; Docker Compose; Ansible; Terraform |
Informace o studiu
| Studijní program / obor: | Informační systémy a technologie/Vývoj informačních systémů |
|---|---|
| Typ studijního programu: | Magisterský studijní program |
| Přidělovaná hodnost: | Ing. |
| Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
| Fakulta: | Fakulta informatiky a statistiky |
| Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
| Datum zadání práce: | 4. 1. 2024 |
|---|---|
| Datum podání práce: | 2. 5. 2026 |
| Datum obhajoby: | 2. 6. 2026 |
| Identifikátor v systému InSIS: | https://insis.vse.cz/zp/88620/podrobnosti |