Návrh a implementace frameworku pro tvorbu webových scraperů v jazyce Swift

Název práce: Návrh a implementace frameworku pro tvorbu webových scraperů v jazyce Swift
Autor(ka) práce: Nováček, Stanislav
Typ práce: Diplomová práce
Vedoucí práce: Pavlíčková, Jarmila
Oponenti práce: Král, David
Jazyk práce: Česky
Abstrakt:
Cíle této diplomové práce byly vytyčeny dva – vytvoření open-souce knihovny pro tvorbu webových crawlerů a scraperů v programovacím jazyce Swift; a implementace webového scraperu za pomocí této knihovny. Pro splnění prvního cíle byla provedena analýza scrapovacího procesu a existujících knihoven určených pro scrapování webových stránek napsaných v programovacím jazyce Swift. Po této analýze došlo k návrhu decentralizované architektury a definici požadavků, které sloužily jako podklad pro implementaci knihovny. Po dokončení implementace bylo pro zjištění splnění prvního cíle provedeno tabulkové srovnání nové knihovny s knihovnami existujícími dle určených požadavků. Pro splnění druhého cíle bylo definováno zadání a případ užití webového scraperu. Podle tohoto zadání byla navržena architektura a komponenty, které sloužily jako podklady pro implementaci programu. Pro zjištění splnění druhého cíle byla provedena demonstrace tohoto scraperu na vybraném webu.
Klíčová slova: crawling; knihovna; scraping; Swift; web crawling; web scraping; decentralizovaný; framework
Název práce: Design and implementation of a framework for creating web scrapers in Swift programming language
Autor(ka) práce: Nováček, Stanislav
Typ práce: Diploma thesis
Vedoucí práce: Pavlíčková, Jarmila
Oponenti práce: Král, David
Jazyk práce: Česky
Abstrakt:
There were two goals defined for this diploma thesis – first, to implement an open-source library for creating web crawlers and web scrapers written in Swift programming language; second, to implement a web scraper using this library and to use this scraper on some chosen website as a demonstration. To successfully accomplish the first goal, an analysis of the scraping process and existing libraries was carried out and a decentralized architecture with a list of requirements was defined based upon the analysis. A new library was implemented according to the requirements and architecture. A tabular comparison of the new library and existing ones was made to determine if the first goal had been successfully met. To successfully accomplish the second goal, a description and a use case of a web scraper were defined. Based upon given description and the use case an architecture and components were designed. With these designs in mind a web scraping program was implemented and used to scrape data from a chosen website as a demonstration. This demonstration was carried out to determine if the second goal had been achieved.
Klíčová slova: scraping; Swift; web crawling; web scraping; crawling; decentralized; framework; library

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 18. 9. 2017
Datum podání práce: 30. 11. 2018
Datum obhajoby: 21. 1. 2019
Identifikátor v systému InSIS: https://insis.vse.cz/zp/63536/podrobnosti

Soubory ke stažení

    Poslední aktualizace: