Prediction of real estate prices in the Czech Republic

Thesis title: Predikce cen nemovitostí v ČR
Author: Fonos, Patrik
Thesis type: Diplomová práce
Supervisor: Sýkora, Lukáš
Opponents: Staš, Vojtěch
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá predikcí cen nemovitostí v České republice, což je klíčové téma vzhledem k vysokému podílu vlastníků nemovitostí a častým případům přeplácení při jejich koupi. Hlavním cílem je aplikovat a vyhodnotit různé metody predikce cen nemovitostí na českém realitním trhu s byty, za pomoci technologií strojového učení. Práce postupně pokrývá historii a vývoj predikčních metod, jejich teoretické základy až po praktické aplikace, s důrazem na správný sběr a čištění dat pro účely predikce. Analýza různých prediktivních modelů odhalila, že metody založené na XGBoost, zejména když jsou kombinovány s pokročilými technikami pro výběr příznaků a optimalizaci hyperparametrů, nabízejí nejlepší výsledky. Nejnižší střední absolutní chybu (459770 Kč) dosáhl model XGBoost regresor kombinovaný s RandomizedSearchCV a metodou SHAP. Tento výsledek byl podpořen vizuální analýzou, která ukázala vysokou přesnost modelu při predikci cen nemovitostí do čtyř milionů korun, s určitými odchylkami u vyšších cenových kategorií. Bylo také zjištěno, že TensorFlow poskytuje srovnatelné výsledky s některými tradičními modely. Práce přispívá k lepšímu porozumění a předpovídání cen nemovitostí v ČR, což je klíčové pro kupující, prodejce a investory na realitním trhu.
Keywords: strojové učení; predikce; nemovitosti
Thesis title: Prediction of real estate prices in the Czech Republic
Author: Fonos, Patrik
Thesis type: Diploma thesis
Supervisor: Sýkora, Lukáš
Opponents: Staš, Vojtěch
Thesis language: Česky
Abstract:
This thesis focuses on the prediction of real estate prices in the Czech Republic, which is a key topic due to the high proportion of property owners and frequent cases of overpaying when buying real estate. The main objective is to apply and evaluate different methods of real estate price prediction in the Czech housing market, using machine learning techniques. The thesis gradually covers the history and development of prediction methods, their theoretical foundations to practical applications, with emphasis on proper data collection and cleaning for prediction purposes. The analysis of different predictive models reveals that XGBoost-based methods, especially when combined with advanced techniques for feature selection and hyperparameter optimization, offer the best results. The XGBoost regressor model combined with RandomizedSearchCV and the SHAP method achieved the lowest mean absolute error (459770 CZK). This result was supported by visual analysis, which showed high accuracy of the model in predicting property prices up to CZK 4 million, with some deviations for higher price categories. TensorFlow was also found to provide comparable results to some traditional models. The work contributes to a better understanding and prediction of property prices in the country, which is crucial for buyers, sellers and investors in the real estate market.
Keywords: prediction; real estate; machine learning

Information about study

Study programme: Informační management
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 7. 12. 2022
Date of submission: 3. 12. 2023
Date of defense: 25. 1. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/83050/podrobnosti

Files for download

    Last update: