Časové řady nemovitostního trhu a jejich limitace v kontrastu strojového učení
| Thesis title: | Časové řady nemovitostního trhu a jejich limitace v kontrastu strojového učení |
|---|---|
| Author: | Hrbek, Petr |
| Thesis type: | Diploma thesis |
| Supervisor: | Kaizr, Jaroslav |
| Opponents: | Pláničková, Markéta |
| Thesis language: | English |
| Abstract: | This master’s thesis compares traditional time-series forecasting models with modern machine learning approaches for predicting house prices in King County, Washington (2013–2022). The study evaluates classical autoregressive models (ARIMA/SARIMA) alongside ensemble gradient boosting algorithms (XGBoost, LightGBM, CatBoost) using an expanding-window backtesting framework in skforecast library. The analysis focuses on the monthly median sale price series for multiple urban submarkets. Model variants are trained on univariate price-only time series as well as on enriched datasets that incorporate property-specific technical attributes and socio-demographic indicators as exogenous features. Forecast accuracy is evaluated using Mean Absolute Error (MAE) and Mean Absolute Percentage Error (MAPE) metrics. The results indicate that machine learning models generally achieve higher predictive accuracy in volatile or irregular submarkets, whereas a seasonal ARIMA can match or even outperform ML models in submarkets with strong seasonal patterns and stable trends. Incorporating extra features (e.g. house attributes, income, population) improves predictions in some submarkets, particularly where past prices alone do not capture important local factors, but yields little benefit or even a slight performance degradation in others with well-structured trends and seasonality. Overall, no single model dominates across all conditions; the optimal modeling approach depends on each submarket’s characteristics. |
| Keywords: | skofrecast; real estate; machine learning; time series |
| Thesis title: | Časové řady nemovitostního trhu a jejich limitace v kontrastu strojového učení |
|---|---|
| Author: | Hrbek, Petr |
| Thesis type: | Diplomová práce |
| Supervisor: | Kaizr, Jaroslav |
| Opponents: | Pláničková, Markéta |
| Thesis language: | English |
| Abstract: | Tato diplomová práce srovnává tradiční modely časových řad s moderními metodami strojového učení při predikci cen domů v okrese King County ve státě Washington (2013–2022). Studie hodnotí klasické autoregresivní modely (ARIMA/SARIMA) i ensámblové algoritmy gradientního boostingu (XGBoost, LightGBM, CatBoost) za použití rámce backtestingu a knihovny skforecast s postupně rozšiřujícím se oknem. Analýza se zaměřuje na měsíční mediánové ceny prodaných domů v několika městských dílčích subtrzích. Varianty modelů jsou trénovány jak na univariátních časových řadách obsahujících pouze historické ceny, tak na rozšířených datasetech zahrnujících technické charakteristiky nemovitostí a sociodemografické ukazatele jako exogenní proměnné. Přesnost prognóz je vyhodnocena pomocí metrik střední absolutní chyby (MAE) a střední absolutní procentní chyby (MAPE). Výsledky ukazují, že modely strojového učení obecně dosahují vyšší predikční přesnosti v volatilních nebo nepravidelných dílčích subtrzích, zatímco sezónní model ARIMA může v oblastech s výrazným sezónním charakterem a stabilním trendem dosahovat srovnatelné či dokonce vyšší přesnosti než modely strojového učení. Začlenění dodatečných proměnných (např. technických atributů nemovitosti, příjmů, velikosti populace) zlepšuje prognózy v některých dílčích subtrzích, zejména tam, kde samotné minulé ceny nedokážou postihnout důležité regionální faktory. V jiných subtrzích s dobře strukturovaným trendem a sezónností však tento krok přináší pouze nepatrný přínos nebo dokonce mírné zhoršení přesnosti. Celkově se žádný model neukázal být univerzálně nejlepší, optimální přístup závisí na charakteristikách konkrétního dílčího subtrhu. |
| Keywords: | strojové učení; real estate; skforecast; časové řady |
Information about study
| Study programme: | Finance a oceňování podniku |
|---|---|
| Type of study programme: | Magisterský studijní program |
| Assigned degree: | Ing. |
| Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
| Faculty: | Faculty of Finance and Accounting |
| Department: | Department of Corporate Finance |
Information on submission and defense
| Date of assignment: | 21. 11. 2024 |
|---|---|
| Date of submission: | 12. 8. 2025 |
| Date of defense: | 3. 9. 2025 |
| Identifier in the InSIS system: | https://insis.vse.cz/zp/90465/podrobnosti |