Real Estate Price Prediction in Prague

Thesis title: Predikce cen nemovitostí v Praze
Author: Vrána, Jan
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Švarc, Lukáš
Thesis language: Česky
Abstract:
Bakalářská práce se zaměřuje na predikci tržních cen rezidenčních nemovitostí na území hlavního města Prahy. Cílem bylo navrhnout a vyhodnotit prediktivní model, který na základě technických a lokalizačních atributů nemovitosti a dostupnosti občanské vybavenosti odhadne její tržní hodnotu. Data byla získána technikou web scrapingu z veřejného rozhraní realitního portálu (dále označovaného jako „RealityXYZ“), přičemž přístup k datům byl se společností předem konzultován a schválen. Metodika práce vychází z rámce KDD (Knowledge Discovery in Databases) a pokrývá proces od výběru a předzpracování dat, přes jejich transformaci až po tvorbu a ladění regresních modelů. V rámci experimentů byly porovnány různé algoritmy strojového učení. Nejlepší predikční přesnosti bylo dosaženo při použití ensemble metod - konkrétně modelů Random Forest a Gradient Boosting. Pro zlepšení lokalizačních vstupů byla data doplněna o geolokační informace z externích API. Výsledky ukazují, že zahrnutí atributů jako vzdálenost k metru, městská čtvrť a obvod vý- znamně přispívá ke zlepšení přesnosti modelu. Navržený přístup dosáhl v případě bytů rela- tivní chyby (MAE) pod 14 % a může sloužit jako základ pro prakticky využitelný nástroj při odhadu cen v městském prostředí.
Keywords: nemovitosti; web scraping; predikce cen; Praha; strojové učení
Thesis title: Real Estate Price Prediction in Prague
Author: Vrána, Jan
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Švarc, Lukáš
Thesis language: Česky
Abstract:
The bachelor’s thesis focuses on the prediction of market prices of residential properties in the city of Prague. The aim was to design and evaluate a predictive model that estimates pro- perty value based on technical characteristics, location attributes, and accessibility of public infrastructure. Data were obtained via web scraping from a public interface of a real estate platform (referred to hereinafter as "RealityXYZ"), with prior consultation and approval from the company. The methodology is based on the KDD (Knowledge Discovery in Databases) framework and covers the entire process from data selection and preprocessing through transformation to the training and tuning of regression models. Various machine learning algorithms were compared, with the best performance achieved by ensemble methods—specifically, Random Forest and Gradient Boosting. To improve the quality of location-based inputs, geolocation data from external APIs were integrated. The results show that incorporating features such as distance to the nearest metro station, city district, and administrative borough significantly improves model accuracy. The proposed approach achieved a relative mean absolute error (MAE) below 14% for apartment predictions and can serve as a foundation for a practical tool for urban price estimation.
Keywords: price prediction; Prague; real estates; machine learning; web scraping

Information about study

Study programme: Data Analytics
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 5. 11. 2024
Date of submission: 12. 5. 2025
Date of defense: 16. 6. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/90252/podrobnosti

Files for download

    Last update: