Design and Implementation of System for Aggregations of Real Estate Offers in the Czech Republic

Thesis title: Návrh a implementace systému na agregaci nabídky nemovitostí v České republice
Author: Drobník, Jakub
Thesis type: Diplomová práce
Supervisor: Kučera, Jan
Opponents: Chlapek, Dušan
Thesis language: Česky
Abstract:
Diplomová práce se zabývá návrhem a implementací systému na agregaci nabídky nemovitostí v České republice. Cíl práce je vytvořit systém, který umožní agregovat data o realitních nabídkách, které jsou dostupné na internetu. Práce se skládá ze dvou základních částí, v první části práce je čtenář uveden do řešené problematiky, v druhé části je pak popsán návrh a implementace systému. V první části práce se autor zabývá způsoby, jak lze získávat data z webových stránek, zejména extrakcí dat pomocí automatických robotů. Druhá část práce se věnuje návrhu a implementaci systému pro agregaci dat. V této části jsou identifikovány požadavky na systém, které jsou vytvořeny spolu se zadavatelem systému. Na základě definovaných požadavků je vytvořen návrh systému, tento návrh je poté implementován. Výstupem práce je funkční prototyp systému, který agreguje data z realitních portálů do připravené databáze. Hlavním přínosem práce je ukázka možného přístupu, jakým lze agregovat data z určitého segmentu trhu do databáze.
Keywords: extrakce dat; web scraping; nestrukturovaná data; agregace dat; strukturovaná data; ontologie; webová aplikace
Thesis title: Design and Implementation of System for Aggregations of Real Estate Offers in the Czech Republic
Author: Drobník, Jakub
Thesis type: Diploma thesis
Supervisor: Kučera, Jan
Opponents: Chlapek, Dušan
Thesis language: Česky
Abstract:
The diploma thesis deals with the design and implementation of software for aggregations of real estate offers in the Czech Republic. The aim of the thesis is to create a system which aggregates the data of real estate offers from web pages. This thesis consists of two basic parts. The context of creating the system is described in the first part. The author discusses ways to retrieve data from websites - especially the extraction of data using automated robots - in the first part of the thesis. The design and implementation of the system are described in the second part. The author and sponsor define requirements for the system in the second part of the thesis. The outcome of this thesis is a prototype that aggregates data from real estate portals into the prepared database. The main contribution of the thesis is an example of a possible approach that can aggregate data from a particular market segment and put it into the database.
Keywords: structured data; ontologies; web application; data aggregation; data extraction; web scraping; unstructured data

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 31. 3. 2016
Date of submission: 26. 4. 2017
Date of defense: 30. 5. 2017
Identifier in the InSIS system: https://insis.vse.cz/zp/57182/podrobnosti

Files for download

    Last update: