Predikce cen nemovitostí v Praze

Název práce: Predikce cen nemovitostí v Praze
Autor(ka) práce: Vrána, Jan
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Švarc, Lukáš
Jazyk práce: Česky
Abstrakt:
Bakalářská práce se zaměřuje na predikci tržních cen rezidenčních nemovitostí na území hlavního města Prahy. Cílem bylo navrhnout a vyhodnotit prediktivní model, který na základě technických a lokalizačních atributů nemovitosti a dostupnosti občanské vybavenosti odhadne její tržní hodnotu. Data byla získána technikou web scrapingu z veřejného rozhraní realitního portálu (dále označovaného jako „RealityXYZ“), přičemž přístup k datům byl se společností předem konzultován a schválen. Metodika práce vychází z rámce KDD (Knowledge Discovery in Databases) a pokrývá proces od výběru a předzpracování dat, přes jejich transformaci až po tvorbu a ladění regresních modelů. V rámci experimentů byly porovnány různé algoritmy strojového učení. Nejlepší predikční přesnosti bylo dosaženo při použití ensemble metod - konkrétně modelů Random Forest a Gradient Boosting. Pro zlepšení lokalizačních vstupů byla data doplněna o geolokační informace z externích API. Výsledky ukazují, že zahrnutí atributů jako vzdálenost k metru, městská čtvrť a obvod vý- znamně přispívá ke zlepšení přesnosti modelu. Navržený přístup dosáhl v případě bytů rela- tivní chyby (MAE) pod 14 % a může sloužit jako základ pro prakticky využitelný nástroj při odhadu cen v městském prostředí.
Klíčová slova: nemovitosti; web scraping; predikce cen; Praha; strojové učení
Název práce: Real Estate Price Prediction in Prague
Autor(ka) práce: Vrána, Jan
Typ práce: Bachelor thesis
Vedoucí práce: Chudán, David
Oponenti práce: Švarc, Lukáš
Jazyk práce: Česky
Abstrakt:
The bachelor’s thesis focuses on the prediction of market prices of residential properties in the city of Prague. The aim was to design and evaluate a predictive model that estimates pro- perty value based on technical characteristics, location attributes, and accessibility of public infrastructure. Data were obtained via web scraping from a public interface of a real estate platform (referred to hereinafter as "RealityXYZ"), with prior consultation and approval from the company. The methodology is based on the KDD (Knowledge Discovery in Databases) framework and covers the entire process from data selection and preprocessing through transformation to the training and tuning of regression models. Various machine learning algorithms were compared, with the best performance achieved by ensemble methods—specifically, Random Forest and Gradient Boosting. To improve the quality of location-based inputs, geolocation data from external APIs were integrated. The results show that incorporating features such as distance to the nearest metro station, city district, and administrative borough significantly improves model accuracy. The proposed approach achieved a relative mean absolute error (MAE) below 14% for apartment predictions and can serve as a foundation for a practical tool for urban price estimation.
Klíčová slova: price prediction; Prague; real estates; machine learning; web scraping

Informace o studiu

Studijní program / obor: Data Analytics
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 5. 11. 2024
Datum podání práce: 12. 5. 2025
Datum obhajoby: 16. 6. 2025
Identifikátor v systému InSIS: https://insis.vse.cz/zp/90252/podrobnosti

Soubory ke stažení

    Poslední aktualizace: