Design and implementation of a website monitor

Thesis title: Návrh a implementace univerzálního monitoru webových stránek
Author: Nguyen Viet, Anh
Thesis type: Bakalářská práce
Supervisor: Sklenák, Vilém
Opponents: Vojíř, Stanislav
Thesis language: Česky
Abstract:
Hlavním cílem bakalářské práce je návrh a vytvoření aplikace sloužící k upozornění uživatele na nově přidané webové stránky v rámci jedné domény, a to v reálném čase. Program byl realizován ve frameworku Node.js se znalostí programovacího jazyka JavaScript. Práce dokumentuje celý proces od návrhu až po samotnou implementaci včetně vyskytlých problémů. K dosažení primárního cíle bylo nutné splnit dílčí cíle. Jedním z nich je rozšířit si znalosti a vnést náhled do problematiky spojené s extrakcí dat. To zahrnuje vysvětlení základních termínů, principu fungování vyhledávačů. Dále je rozebrána právní stránka týkající se získávání cizích dat a porovnání vhodných programovacích jazyků.
Keywords: web scraping; JavaScript; web crawling; Node.js; extrakce dat; monitor
Thesis title: Design and implementation of a website monitor
Author: Nguyen Viet, Anh
Thesis type: Bachelor thesis
Supervisor: Sklenák, Vilém
Opponents: Vojíř, Stanislav
Thesis language: Česky
Abstract:
The primary goal of this bachelor thesis is designing and developing an application monitoring newly added websites on the same domain in real-time. The application was created and developed in framework called Node.js with the experience of the programming language JavaScript. The work maps the whole process from design to implementation including detailed descriptions of occurred problems. In order to reach primary goal, there were partial goals which needed to be accomplished. One of those was to gain more knowledge about data extraction and explain essential concepts in this area, e.g., how search engines work. Moreover, it offers legal analysis and comparison of suitable programming languages for the purposes of the project.
Keywords: data extraction; monitor; web crawling; web scraping; Node.js; JavaScript

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 29. 1. 2020
Date of submission: 14. 12. 2020
Date of defense: 4. 2. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/72315/podrobnosti

Files for download

    Last update: