Predikce cen nemovitostí v Praze
Název práce: | Predikce cen nemovitostí v Praze |
---|---|
Autor(ka) práce: | Vrána, Jan |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Švarc, Lukáš |
Jazyk práce: | Česky |
Abstrakt: | Bakalářská práce se zaměřuje na predikci tržních cen rezidenčních nemovitostí na území hlavního města Prahy. Cílem bylo navrhnout a vyhodnotit prediktivní model, který na základě technických a lokalizačních atributů nemovitosti a dostupnosti občanské vybavenosti odhadne její tržní hodnotu. Data byla získána technikou web scrapingu z veřejného rozhraní realitního portálu (dále označovaného jako „RealityXYZ“), přičemž přístup k datům byl se společností předem konzultován a schválen. Metodika práce vychází z rámce KDD (Knowledge Discovery in Databases) a pokrývá proces od výběru a předzpracování dat, přes jejich transformaci až po tvorbu a ladění regresních modelů. V rámci experimentů byly porovnány různé algoritmy strojového učení. Nejlepší predikční přesnosti bylo dosaženo při použití ensemble metod - konkrétně modelů Random Forest a Gradient Boosting. Pro zlepšení lokalizačních vstupů byla data doplněna o geolokační informace z externích API. Výsledky ukazují, že zahrnutí atributů jako vzdálenost k metru, městská čtvrť a obvod vý- znamně přispívá ke zlepšení přesnosti modelu. Navržený přístup dosáhl v případě bytů rela- tivní chyby (MAE) pod 14 % a může sloužit jako základ pro prakticky využitelný nástroj při odhadu cen v městském prostředí. |
Klíčová slova: | nemovitosti; web scraping; predikce cen; Praha; strojové učení |
Název práce: | Real Estate Price Prediction in Prague |
---|---|
Autor(ka) práce: | Vrána, Jan |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Švarc, Lukáš |
Jazyk práce: | Česky |
Abstrakt: | The bachelor’s thesis focuses on the prediction of market prices of residential properties in the city of Prague. The aim was to design and evaluate a predictive model that estimates pro- perty value based on technical characteristics, location attributes, and accessibility of public infrastructure. Data were obtained via web scraping from a public interface of a real estate platform (referred to hereinafter as "RealityXYZ"), with prior consultation and approval from the company. The methodology is based on the KDD (Knowledge Discovery in Databases) framework and covers the entire process from data selection and preprocessing through transformation to the training and tuning of regression models. Various machine learning algorithms were compared, with the best performance achieved by ensemble methods—specifically, Random Forest and Gradient Boosting. To improve the quality of location-based inputs, geolocation data from external APIs were integrated. The results show that incorporating features such as distance to the nearest metro station, city district, and administrative borough significantly improves model accuracy. The proposed approach achieved a relative mean absolute error (MAE) below 14% for apartment predictions and can serve as a foundation for a practical tool for urban price estimation. |
Klíčová slova: | price prediction; Prague; real estates; machine learning; web scraping |
Informace o studiu
Studijní program / obor: | Data Analytics |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 5. 11. 2024 |
---|---|
Datum podání práce: | 12. 5. 2025 |
Datum obhajoby: | 16. 6. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/90252/podrobnosti |