Design and implementation of a website monitor
Thesis title: | Návrh a implementace univerzálního monitoru webových stránek |
---|---|
Author: | Nguyen Viet, Anh |
Thesis type: | Bakalářská práce |
Supervisor: | Sklenák, Vilém |
Opponents: | Vojíř, Stanislav |
Thesis language: | Česky |
Abstract: | Hlavním cílem bakalářské práce je návrh a vytvoření aplikace sloužící k upozornění uživatele na nově přidané webové stránky v rámci jedné domény, a to v reálném čase. Program byl realizován ve frameworku Node.js se znalostí programovacího jazyka JavaScript. Práce dokumentuje celý proces od návrhu až po samotnou implementaci včetně vyskytlých problémů. K dosažení primárního cíle bylo nutné splnit dílčí cíle. Jedním z nich je rozšířit si znalosti a vnést náhled do problematiky spojené s extrakcí dat. To zahrnuje vysvětlení základních termínů, principu fungování vyhledávačů. Dále je rozebrána právní stránka týkající se získávání cizích dat a porovnání vhodných programovacích jazyků. |
Keywords: | web scraping; JavaScript; web crawling; Node.js; extrakce dat; monitor |
Thesis title: | Design and implementation of a website monitor |
---|---|
Author: | Nguyen Viet, Anh |
Thesis type: | Bachelor thesis |
Supervisor: | Sklenák, Vilém |
Opponents: | Vojíř, Stanislav |
Thesis language: | Česky |
Abstract: | The primary goal of this bachelor thesis is designing and developing an application monitoring newly added websites on the same domain in real-time. The application was created and developed in framework called Node.js with the experience of the programming language JavaScript. The work maps the whole process from design to implementation including detailed descriptions of occurred problems. In order to reach primary goal, there were partial goals which needed to be accomplished. One of those was to gain more knowledge about data extraction and explain essential concepts in this area, e.g., how search engines work. Moreover, it offers legal analysis and comparison of suitable programming languages for the purposes of the project. |
Keywords: | data extraction; monitor; web crawling; web scraping; Node.js; JavaScript |
Information about study
Study programme: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 29. 1. 2020 |
---|---|
Date of submission: | 14. 12. 2020 |
Date of defense: | 4. 2. 2021 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/72315/podrobnosti |