Porovnání modelů pro predikci cen nemovitostí na reálných datech

Název práce: Porovnání modelů pro predikci cen nemovitostí na reálných datech
Autor(ka) práce: Jindráček, Tadeáš
Typ práce: Bakalářská práce
Vedoucí práce: Zeman, Václav
Oponenti práce: Kliegr, Tomáš
Jazyk práce: Česky
Abstrakt:
Cílem této bakalářské práce je využití technik web scraping pro získání reálných dat, aplikace vybraných regresních modelů pro odhad ceny nemovitosti a následné porovnání těchto modelů. Práce se dělí na teoretickou a praktickou část. V teoretické části je představena oblast web scrapingu, včetně etických a právních aspektů web scrapingu. Dále jsou popsány domény data miningu, strojového učení, neuronových sítí a principů regresní analýzy. U jednotlivých regresních modelů je popsán jejich teoretický základ, výhody, nevýhody, jejich aplikovatelnost a omezení na reálném realitním trhu. Praktická část obsahuje aplikaci web scrapingu, následnou tvorbu a předzpracování datasetu, využití jednotlivých predikčních modelů, jejich evaluaci a vizualizace. Po praktické části práce jsou diskutovány jednotlivé výsledky. Jsou rozebrány rozdíly ve výkonu jednotlivých modelů, vzájemné porovnání a diskuse vhodnosti použití v praxi. V závěru je celá práce shrnuta, vyzdviženy klíčové přínosy a jsou nastíněna možná rozšíření do budoucna.
Klíčová slova: web scraping; regresní analýza; strojové učení; CRISP-DM; Feature Extraction
Název práce: Comparison of models for predicting Real Estate Prices on Real Data
Autor(ka) práce: Jindráček, Tadeáš
Typ práce: Bachelor thesis
Vedoucí práce: Zeman, Václav
Oponenti práce: Kliegr, Tomáš
Jazyk práce: Česky
Abstrakt:
The aim of this bachelor thesis is the use of web scraping techniques to obtain real data, application of selected regression models for estimation of property price and subsequent comparison of these models. The thesis is divided into theoretical and practical parts. The theoretical part introduces the field of web scraping, including ethical and legal aspects of web scraping. Furthermore, the domains of data mining, machi ne learning, neural networks and regression analysis principles are described. For each regression model, the theoretical basis, advantages, disadvantages, applicability and limitations in the real estate market are described. The practical part includes the application of web scraping, subsequent creation and preprocessing of dataset, use of individual prediction models, their evaluation and visualization. After the practical part of the paper, the individual results are discussed. Differences in the performance of each model, inter-comparisons and discussion of the suitability for practical use are discussed. Finally, the whole work is summarized, key contributions are highlighted, and possible future extensions are outlined.
Klíčová slova: regression analysis; machine learning; web scraping; CRISP-DM; Feature Extraction

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 3. 1. 2025
Datum podání práce: 12. 5. 2025
Datum obhajoby: 2025

Soubory ke stažení

Soubory budou k dispozici až po obhajobě práce.

    Poslední aktualizace: