Application for Retrieving and Scoring Data from Real Estate Servers
Thesis title: | Aplikace pro získávání a hodnocení dat z realitních serverů |
---|---|
Author: | Hradil, Adam |
Thesis type: | Bakalářská práce |
Supervisor: | Vencovský, Filip |
Opponents: | Bruckner, Tomáš |
Thesis language: | Česky |
Abstract: | Tato bakalářská práce se zabývá návrhem a implementací aplikace pro získávání a hodnocení inzerátů z vybraných českých realitních serverů. Cílem práce bylo vytvořit systém, který periodicky sbírá, ukládá a analyzuje data z realitních inzerátů. Aplikace získané inzeráty na základě jejich obsahu a definovaných uživatelských preferencí číselně ohodnotí, seřadí a informuje o nich uživatele. Zapojené realitní servery použité pro získávání dat jsou Sreality a Bezrealitky. V práci dochází k použití různých metod a přístupů, včetně prototypování, metody váženého součtu pro výpočet hodnocení nebo web scrapingu, sloužícího k získání webových dat za použití Scrapy frameworku v programovacím jazyce Python. Ohodnocené inzeráty aplikace zprostředkovává formou notifikace uživatele na komunikační platformě Discord a také prostřednictvím jednoduché webové aplikace, vytvořené pomocí Flask frameworku. Výsledky ukazují, že je systém schopen efektivně sbírat data z realitních inzerátů, na základě kterých uživatelům umožňuje inzeráty díky hodnocení jednoduše porovnat. Autor v práci identifikuje konkrétní možnosti rozšíření funkcionality a diskutuje problémy spojené s limitacemi ze strany realitních serverů. |
Keywords: | web scraping; scoring; hodnocení nemovitostí; Scrapy; realitní inzeráty; realitní trh |
Thesis title: | Application for Retrieving and Scoring Data from Real Estate Servers |
---|---|
Author: | Hradil, Adam |
Thesis type: | Bachelor thesis |
Supervisor: | Vencovský, Filip |
Opponents: | Bruckner, Tomáš |
Thesis language: | Česky |
Abstract: | This bachelor’s thesis focuses on designing and implementing an application for retrieving and scoring real estate listings from selected Czech real estate servers. This project aimed to create a system that periodically collects, stores, and analyses data from real estate listings. Based on their content and defined user preferences, the application numerically scores, sorts, and informs the user about the listings. Sreality and Bezrealitky have been chosen as the real estate platforms used for data acquisition. Various methods and approaches were used in this thesis, including prototyping, the weighted sum method to score the listings, or web scraping, used to extract web data using the Scrapy framework in the Python programming language. The scored listings are delivered to the user through notifications on the Discord communication platform and through a simple web application created using the Flask framework. The results show that the system can efficiently collect data from real estate listings, which allows users to easily compare listings based on the calculated ratings. The author also identifies specific features that could extend the existing functionality and discusses issues related to limitations imposed by real estate platforms. |
Keywords: | real estate market; real estate listings; scoring; real estate scoring; Scrapy; web scraping |
Information about study
Study programme: | Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 1. 10. 2023 |
---|---|
Date of submission: | 5. 5. 2024 |
Date of defense: | 10. 6. 2024 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/87127/podrobnosti |