Real Estate Price Prediction in Prague
Thesis title: | Predikce cen nemovitostí v Praze |
---|---|
Author: | Vrána, Jan |
Thesis type: | Bakalářská práce |
Supervisor: | Chudán, David |
Opponents: | Švarc, Lukáš |
Thesis language: | Česky |
Abstract: | Bakalářská práce se zaměřuje na predikci tržních cen rezidenčních nemovitostí na území hlavního města Prahy. Cílem bylo navrhnout a vyhodnotit prediktivní model, který na základě technických a lokalizačních atributů nemovitosti a dostupnosti občanské vybavenosti odhadne její tržní hodnotu. Data byla získána technikou web scrapingu z veřejného rozhraní realitního portálu (dále označovaného jako „RealityXYZ“), přičemž přístup k datům byl se společností předem konzultován a schválen. Metodika práce vychází z rámce KDD (Knowledge Discovery in Databases) a pokrývá proces od výběru a předzpracování dat, přes jejich transformaci až po tvorbu a ladění regresních modelů. V rámci experimentů byly porovnány různé algoritmy strojového učení. Nejlepší predikční přesnosti bylo dosaženo při použití ensemble metod - konkrétně modelů Random Forest a Gradient Boosting. Pro zlepšení lokalizačních vstupů byla data doplněna o geolokační informace z externích API. Výsledky ukazují, že zahrnutí atributů jako vzdálenost k metru, městská čtvrť a obvod vý- znamně přispívá ke zlepšení přesnosti modelu. Navržený přístup dosáhl v případě bytů rela- tivní chyby (MAE) pod 14 % a může sloužit jako základ pro prakticky využitelný nástroj při odhadu cen v městském prostředí. |
Keywords: | nemovitosti; web scraping; predikce cen; Praha; strojové učení |
Thesis title: | Real Estate Price Prediction in Prague |
---|---|
Author: | Vrána, Jan |
Thesis type: | Bachelor thesis |
Supervisor: | Chudán, David |
Opponents: | Švarc, Lukáš |
Thesis language: | Česky |
Abstract: | The bachelor’s thesis focuses on the prediction of market prices of residential properties in the city of Prague. The aim was to design and evaluate a predictive model that estimates pro- perty value based on technical characteristics, location attributes, and accessibility of public infrastructure. Data were obtained via web scraping from a public interface of a real estate platform (referred to hereinafter as "RealityXYZ"), with prior consultation and approval from the company. The methodology is based on the KDD (Knowledge Discovery in Databases) framework and covers the entire process from data selection and preprocessing through transformation to the training and tuning of regression models. Various machine learning algorithms were compared, with the best performance achieved by ensemble methods—specifically, Random Forest and Gradient Boosting. To improve the quality of location-based inputs, geolocation data from external APIs were integrated. The results show that incorporating features such as distance to the nearest metro station, city district, and administrative borough significantly improves model accuracy. The proposed approach achieved a relative mean absolute error (MAE) below 14% for apartment predictions and can serve as a foundation for a practical tool for urban price estimation. |
Keywords: | price prediction; Prague; real estates; machine learning; web scraping |
Information about study
Study programme: | Data Analytics |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 5. 11. 2024 |
---|---|
Date of submission: | 12. 5. 2025 |
Date of defense: | 16. 6. 2025 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/90252/podrobnosti |