Application for Retrieving and Scoring Data from Real Estate Servers

Thesis title: Aplikace pro získávání a hodnocení dat z realitních serverů
Author: Hradil, Adam
Thesis type: Bakalářská práce
Supervisor: Vencovský, Filip
Opponents: Bruckner, Tomáš
Thesis language: Česky
Abstract:
Tato bakalářská práce se zabývá návrhem a implementací aplikace pro získávání a hodnocení inzerátů z vybraných českých realitních serverů. Cílem práce bylo vytvořit systém, který periodicky sbírá, ukládá a analyzuje data z realitních inzerátů. Aplikace získané inzeráty na základě jejich obsahu a definovaných uživatelských preferencí číselně ohodnotí, seřadí a informuje o nich uživatele. Zapojené realitní servery použité pro získávání dat jsou Sreality a Bezrealitky. V práci dochází k použití různých metod a přístupů, včetně prototypování, metody váženého součtu pro výpočet hodnocení nebo web scrapingu, sloužícího k získání webových dat za použití Scrapy frameworku v programovacím jazyce Python. Ohodnocené inzeráty aplikace zprostředkovává formou notifikace uživatele na komunikační platformě Discord a také prostřednictvím jednoduché webové aplikace, vytvořené pomocí Flask frameworku. Výsledky ukazují, že je systém schopen efektivně sbírat data z realitních inzerátů, na základě kterých uživatelům umožňuje inzeráty díky hodnocení jednoduše porovnat. Autor v práci identifikuje konkrétní možnosti rozšíření funkcionality a diskutuje problémy spojené s limitacemi ze strany realitních serverů.
Keywords: web scraping; scoring; hodnocení nemovitostí; Scrapy; realitní inzeráty; realitní trh
Thesis title: Application for Retrieving and Scoring Data from Real Estate Servers
Author: Hradil, Adam
Thesis type: Bachelor thesis
Supervisor: Vencovský, Filip
Opponents: Bruckner, Tomáš
Thesis language: Česky
Abstract:
This bachelor’s thesis focuses on designing and implementing an application for retrieving and scoring real estate listings from selected Czech real estate servers. This project aimed to create a system that periodically collects, stores, and analyses data from real estate listings. Based on their content and defined user preferences, the application numerically scores, sorts, and informs the user about the listings. Sreality and Bezrealitky have been chosen as the real estate platforms used for data acquisition. Various methods and approaches were used in this thesis, including prototyping, the weighted sum method to score the listings, or web scraping, used to extract web data using the Scrapy framework in the Python programming language. The scored listings are delivered to the user through notifications on the Discord communication platform and through a simple web application created using the Flask framework. The results show that the system can efficiently collect data from real estate listings, which allows users to easily compare listings based on the calculated ratings. The author also identifies specific features that could extend the existing functionality and discusses issues related to limitations imposed by real estate platforms.
Keywords: real estate market; real estate listings; scoring; real estate scoring; Scrapy; web scraping

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 1. 10. 2023
Date of submission: 5. 5. 2024
Date of defense: 10. 6. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/87127/podrobnosti

Files for download

    Last update: