Implementace near-real time big data aplikace v praxi
Název práce: | Implementace near-real time big data aplikace v praxi |
---|---|
Autor(ka) práce: | Srp, Daniel |
Typ práce: | Diplomová práce |
Vedoucí práce: | Novotný, Ota |
Oponenti práce: | Kufner, Jiří |
Jazyk práce: | Česky |
Abstrakt: | Tato diplomová práce se zaměřuje na návrh a implementaci near-realtime big data aplikace v konceptu Data Lake podle osvědčených metodik Komerční banky. Hlavním cílem je vytvořit novou aplikaci s názvem LAKE DEUS, která umožní efektivní zpracování a distribuci velkého objemu dat v téměř reálném čase a současně zajistí vysokou kvalitu, dostupnost a spolehlivost dat. Tato práce se hloubkově zabývá koncepty big dat a metodami jejich real-time zpracování. Klíčovým prvkem je podrobný rozbor architektury nové aplikace LAKE DEUS, navržené k implementaci těchto konceptů. Text dále podrobně rozebírá fáze tvorby a nasazení aplikace, její streamové napojení na datový zdroj, jejich následné zpracování a zpřístupnění odběratelům. Přitom se zaměřuje na pokročilé metody zpracování a modelování dat, automatizaci procesů a sledování kvality dat. Jeden z klíčových bodů práce sestává také ze srovnávání a hodnocení různých metod a technologií použitých při implementaci aplikace. Na základě těchto analýz jsou formulována doporučení pro budoucí rozvoj projektu. Výsledkem této práce je komplexní near-realtime big data aplikace, která plní metodické požadavky Komerční banky a bude sloužit jako vzorový model pro budoucí projekty v oblasti big data a near-realtime zpracování dat na big data platformě v koncepci Data Lake. |
Klíčová slova: | data lake; big data; datová architektura; near-realtime zpracování dat; Spark |
Název práce: | Implementation of near-real time big data application in a real-world setting |
---|---|
Autor(ka) práce: | Srp, Daniel |
Typ práce: | Diploma thesis |
Vedoucí práce: | Novotný, Ota |
Oponenti práce: | Kufner, Jiří |
Jazyk práce: | Česky |
Abstrakt: | This thesis focuses on the design and implementation of a near-realtime big data application in the Data Lake concept according to the proven methodologies of Komerční banka. The main goal is to create a new application named LAKE DEUS, which will enable efficient processing and distribution of large volumes of data in near-real time, while ensuring high quality, availability, and reliability of data. This work delves deeply into big data concepts and methods of their real-time processing. A key element is a detailed analysis of the architecture of the new LAKE DEUS application, designed to implement these concepts. The text further elaborately discusses the phases of creation and deployment of the application, its streaming connection to the data source, subsequent processing, and making data available to subscribers. It focuses on advanced methods of data processing and modeling, process automation, and data quality monitoring. One of the key points of the work also consists of comparing and evaluating various methods and technologies used in the application's implementation. Based on these analyses, recommendations for the future development of the project are formulated. The result of this work is a comprehensive near-realtime big data application that meets the methodological requirements of Komerční banka and will serve as a model for future projects in the field of big data and near-realtime data processing on a big data platform in the Data Lake concept. |
Klíčová slova: | Spark; near-realtime data processing; big data; data lake; data architecture |
Informace o studiu
Studijní program / obor: | Data a analytika pro business |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 1. 5. 2023 |
---|---|
Datum podání práce: | 3. 12. 2023 |
Datum obhajoby: | 22. 1. 2024 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/86271/podrobnosti |
Soubory ke stažení
Hlavní práce
Neveřejný soubor Stáhnout
Neveřejný soubor Stáhnout