Comparison of models for predicting Real Estate Prices on Real Data

Thesis title: Porovnání modelů pro predikci cen nemovitostí na reálných datech
Author: Jindráček, Tadeáš
Thesis type: Bakalářská práce
Supervisor: Zeman, Václav
Opponents: Kliegr, Tomáš
Thesis language: Česky
Abstract:
Cílem této bakalářské práce je využití technik web scraping pro získání reálných dat, aplikace vybraných regresních modelů pro odhad ceny nemovitosti a následné porovnání těchto modelů. Práce se dělí na teoretickou a praktickou část. V teoretické části je představena oblast web scrapingu, včetně etických a právních aspektů web scrapingu. Dále jsou popsány domény data miningu, strojového učení, neuronových sítí a principů regresní analýzy. U jednotlivých regresních modelů je popsán jejich teoretický základ, výhody, nevýhody, jejich aplikovatelnost a omezení na reálném realitním trhu. Praktická část obsahuje aplikaci web scrapingu, následnou tvorbu a předzpracování datasetu, využití jednotlivých predikčních modelů, jejich evaluaci a vizualizace. Po praktické části práce jsou diskutovány jednotlivé výsledky. Jsou rozebrány rozdíly ve výkonu jednotlivých modelů, vzájemné porovnání a diskuse vhodnosti použití v praxi. V závěru je celá práce shrnuta, vyzdviženy klíčové přínosy a jsou nastíněna možná rozšíření do budoucna.
Keywords: web scraping; regresní analýza; strojové učení; CRISP-DM; Feature Extraction
Thesis title: Comparison of models for predicting Real Estate Prices on Real Data
Author: Jindráček, Tadeáš
Thesis type: Bachelor thesis
Supervisor: Zeman, Václav
Opponents: Kliegr, Tomáš
Thesis language: Česky
Abstract:
The aim of this bachelor thesis is the use of web scraping techniques to obtain real data, application of selected regression models for estimation of property price and subsequent comparison of these models. The thesis is divided into theoretical and practical parts. The theoretical part introduces the field of web scraping, including ethical and legal aspects of web scraping. Furthermore, the domains of data mining, machi ne learning, neural networks and regression analysis principles are described. For each regression model, the theoretical basis, advantages, disadvantages, applicability and limitations in the real estate market are described. The practical part includes the application of web scraping, subsequent creation and preprocessing of dataset, use of individual prediction models, their evaluation and visualization. After the practical part of the paper, the individual results are discussed. Differences in the performance of each model, inter-comparisons and discussion of the suitability for practical use are discussed. Finally, the whole work is summarized, key contributions are highlighted, and possible future extensions are outlined.
Keywords: regression analysis; machine learning; web scraping; CRISP-DM; Feature Extraction

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 3. 1. 2025
Date of submission: 12. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: