DataHub - Systém pro automatizované stahování dat z internetu

Název práce: DataHub - Systém pro automatizované stahování dat z internetu
Autor(ka) práce: Sedláček, David
Typ práce: Diplomová práce
Vedoucí práce: Maryška, Miloš
Oponenti práce: Kučera, Jan
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se věnuje datovému projektu společnosti Obce v Datech. Cílem práce je popsat vývoj jednotlivých komponent a jejich následnou integraci do datového řešení – Data Hubu, které pomocí inovativních technologií dokáže realizovat bezpečné a inteligentní prohledávání webových stránek a konkrétně zacílit a stahovat data a informace napomáhající k rozvoji datové základny a následného použití stažených dat ke zvyšování datové gramotnosti veřejnosti a veřejné správy. Dílčí cíle, nutné k dosažení kompletního datového řešení sestávají z vytvoření datové platformy a integrování návazných komponent. Mezi tyto komponenty patří webový crawler, který pomocí využití neuronových sítí inteligentně prohledává internet a stahuje data a mobilní aplikace umožňující zobrazovat stažená data a poskytnout celistvý obraz koncovému uživateli. V práci bude položen krátký teoretický základ nutný pro chápání jednotlivých technologií, bude vysvětlen přínos autora projektu a přínos samotného projektu pro společnost, stejně jako zhodnocení celkové práce a pohled na udržitelnost projektu.
Klíčová slova: databáze; web crawler; datový projekt; python; aplikace; data
Název práce: DataHub – Automated web scraper
Autor(ka) práce: Sedláček, David
Typ práce: Diploma thesis
Vedoucí práce: Maryška, Miloš
Oponenti práce: Kučera, Jan
Jazyk práce: Česky
Abstrakt:
This diploma thesis deals with the data project of the company Obce v Datech. The aim of this work is to describe the development of individual components and their subsequent integration into a data solution - Data Hub, which can use innovative technologies to implement secure and intelligent web browsing and specifically target and download data and information to develop the database and subsequent use of downloaded data to increase data literacy of the public and public administration. The partial goals necessary to achieve a complete data solution consist of creating a data platform and integrating related components. These components include a web crawler that uses neural networks to intelligently search the Internet and download data, and mobile applications to view downloaded data and provide a complete picture to the end user. The thesis will lay a short theoretical basis necessary for understanding the various technologies, will explain the contribution of the author of the project and the contribution of the project itself to society, as well as the evaluation of the overall work and a view of project sustainability.
Klíčová slova: python; appliacation; data project; data; web crawler; database

Informace o studiu

Studijní program / obor: Data a analytika pro business
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 20. 7. 2021
Datum podání práce: 29. 6. 2023
Datum obhajoby: 9. 10. 2023
Identifikátor v systému InSIS: https://insis.vse.cz/zp/81054/podrobnosti

Soubory ke stažení

    Poslední aktualizace: