Design and Implementation of System for Aggregations of Real Estate Offers in the Czech Republic
Thesis title: | Návrh a implementace systému na agregaci nabídky nemovitostí v České republice |
---|---|
Author: | Drobník, Jakub |
Thesis type: | Diplomová práce |
Supervisor: | Kučera, Jan |
Opponents: | Chlapek, Dušan |
Thesis language: | Česky |
Abstract: | Diplomová práce se zabývá návrhem a implementací systému na agregaci nabídky nemovitostí v České republice. Cíl práce je vytvořit systém, který umožní agregovat data o realitních nabídkách, které jsou dostupné na internetu. Práce se skládá ze dvou základních částí, v první části práce je čtenář uveden do řešené problematiky, v druhé části je pak popsán návrh a implementace systému. V první části práce se autor zabývá způsoby, jak lze získávat data z webových stránek, zejména extrakcí dat pomocí automatických robotů. Druhá část práce se věnuje návrhu a implementaci systému pro agregaci dat. V této části jsou identifikovány požadavky na systém, které jsou vytvořeny spolu se zadavatelem systému. Na základě definovaných požadavků je vytvořen návrh systému, tento návrh je poté implementován. Výstupem práce je funkční prototyp systému, který agreguje data z realitních portálů do připravené databáze. Hlavním přínosem práce je ukázka možného přístupu, jakým lze agregovat data z určitého segmentu trhu do databáze. |
Keywords: | extrakce dat; web scraping; nestrukturovaná data; agregace dat; strukturovaná data; ontologie; webová aplikace |
Thesis title: | Design and Implementation of System for Aggregations of Real Estate Offers in the Czech Republic |
---|---|
Author: | Drobník, Jakub |
Thesis type: | Diploma thesis |
Supervisor: | Kučera, Jan |
Opponents: | Chlapek, Dušan |
Thesis language: | Česky |
Abstract: | The diploma thesis deals with the design and implementation of software for aggregations of real estate offers in the Czech Republic. The aim of the thesis is to create a system which aggregates the data of real estate offers from web pages. This thesis consists of two basic parts. The context of creating the system is described in the first part. The author discusses ways to retrieve data from websites - especially the extraction of data using automated robots - in the first part of the thesis. The design and implementation of the system are described in the second part. The author and sponsor define requirements for the system in the second part of the thesis. The outcome of this thesis is a prototype that aggregates data from real estate portals into the prepared database. The main contribution of the thesis is an example of a possible approach that can aggregate data from a particular market segment and put it into the database. |
Keywords: | structured data; ontologies; web application; data aggregation; data extraction; web scraping; unstructured data |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 31. 3. 2016 |
---|---|
Date of submission: | 26. 4. 2017 |
Date of defense: | 30. 5. 2017 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/57182/podrobnosti |