Časové řady nemovitostního trhu a jejich limitace v kontrastu strojového učení

Thesis title: Časové řady nemovitostního trhu a jejich limitace v kontrastu strojového učení
Author: Hrbek, Petr
Thesis type: Diploma thesis
Supervisor: Kaizr, Jaroslav
Opponents: Pláničková, Markéta
Thesis language: English
Abstract:
This master’s thesis compares traditional time-series forecasting models with modern machine learning approaches for predicting house prices in King County, Washington (2013–2022). The study evaluates classical autoregressive models (ARIMA/SARIMA) alongside ensemble gradient boosting algorithms (XGBoost, LightGBM, CatBoost) using an expanding-window backtesting framework in skforecast library. The analysis focuses on the monthly median sale price series for multiple urban submarkets. Model variants are trained on univariate price-only time series as well as on enriched datasets that incorporate property-specific technical attributes and socio-demographic indicators as exogenous features. Forecast accuracy is evaluated using Mean Absolute Error (MAE) and Mean Absolute Percentage Error (MAPE) metrics. The results indicate that machine learning models generally achieve higher predictive accuracy in volatile or irregular submarkets, whereas a seasonal ARIMA can match or even outperform ML models in submarkets with strong seasonal patterns and stable trends. Incorporating extra features (e.g. house attributes, income, population) improves predictions in some submarkets, particularly where past prices alone do not capture important local factors, but yields little benefit or even a slight performance degradation in others with well-structured trends and seasonality. Overall, no single model dominates across all conditions; the optimal modeling approach depends on each submarket’s characteristics.
Keywords: skofrecast; real estate; machine learning; time series
Thesis title: Časové řady nemovitostního trhu a jejich limitace v kontrastu strojového učení
Author: Hrbek, Petr
Thesis type: Diplomová práce
Supervisor: Kaizr, Jaroslav
Opponents: Pláničková, Markéta
Thesis language: English
Abstract:
Tato diplomová práce srovnává tradiční modely časových řad s moderními metodami strojového učení při predikci cen domů v okrese King County ve státě Washington (2013–2022). Studie hodnotí klasické autoregresivní modely (ARIMA/SARIMA) i ensámblové algoritmy gradientního boostingu (XGBoost, LightGBM, CatBoost) za použití rámce backtestingu a knihovny skforecast s postupně rozšiřujícím se oknem. Analýza se zaměřuje na měsíční mediánové ceny prodaných domů v několika městských dílčích subtrzích. Varianty modelů jsou trénovány jak na univariátních časových řadách obsahujících pouze historické ceny, tak na rozšířených datasetech zahrnujících technické charakteristiky nemovitostí a sociodemografické ukazatele jako exogenní proměnné. Přesnost prognóz je vyhodnocena pomocí metrik střední absolutní chyby (MAE) a střední absolutní procentní chyby (MAPE). Výsledky ukazují, že modely strojového učení obecně dosahují vyšší predikční přesnosti v volatilních nebo nepravidelných dílčích subtrzích, zatímco sezónní model ARIMA může v oblastech s výrazným sezónním charakterem a stabilním trendem dosahovat srovnatelné či dokonce vyšší přesnosti než modely strojového učení. Začlenění dodatečných proměnných (např. technických atributů nemovitosti, příjmů, velikosti populace) zlepšuje prognózy v některých dílčích subtrzích, zejména tam, kde samotné minulé ceny nedokážou postihnout důležité regionální faktory. V jiných subtrzích s dobře strukturovaným trendem a sezónností však tento krok přináší pouze nepatrný přínos nebo dokonce mírné zhoršení přesnosti. Celkově se žádný model neukázal být univerzálně nejlepší, optimální přístup závisí na charakteristikách konkrétního dílčího subtrhu.
Keywords: strojové učení; real estate; skforecast; časové řady

Information about study

Study programme: Finance a oceňování podniku
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Corporate Finance

Information on submission and defense

Date of assignment: 21. 11. 2024
Date of submission: 12. 8. 2025
Date of defense: 3. 9. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/90465/podrobnosti

Files for download

    Last update: