Thesis title: |
Porovnání modelů pro predikci cen nemovitostí na reálných datech |
Author: |
Jindráček, Tadeáš |
Thesis type: |
Bakalářská práce |
Supervisor: |
Zeman, Václav |
Opponents: |
Kliegr, Tomáš |
Thesis language: |
Česky |
Abstract: |
Cílem této bakalářské práce je využití technik web scraping pro získání reálných dat, aplikace vybraných regresních modelů pro odhad ceny nemovitosti a následné porovnání těchto modelů. Práce se dělí na teoretickou a praktickou část. V teoretické části je představena oblast web scrapingu, včetně etických a právních aspektů web scrapingu. Dále jsou popsány domény data miningu, strojového učení, neuronových sítí a principů regresní analýzy. U jednotlivých regresních modelů je popsán jejich teoretický základ, výhody, nevýhody, jejich aplikovatelnost a omezení na reálném realitním trhu. Praktická část obsahuje aplikaci web scrapingu, následnou tvorbu a předzpracování datasetu, využití jednotlivých predikčních modelů, jejich evaluaci a vizualizace. Po praktické části práce jsou diskutovány jednotlivé výsledky. Jsou rozebrány rozdíly ve výkonu jednotlivých modelů, vzájemné porovnání a diskuse vhodnosti použití v praxi. V závěru je celá práce shrnuta, vyzdviženy klíčové přínosy a jsou nastíněna možná rozšíření do budoucna. |
Keywords: |
web scraping; regresní analýza; strojové učení; CRISP-DM; Feature Extraction |
Thesis title: |
Comparison of models for predicting Real Estate Prices on Real Data |
Author: |
Jindráček, Tadeáš |
Thesis type: |
Bachelor thesis |
Supervisor: |
Zeman, Václav |
Opponents: |
Kliegr, Tomáš |
Thesis language: |
Česky |
Abstract: |
The aim of this bachelor thesis is the use of web scraping techniques to obtain real data, application of selected regression models for estimation of property price and subsequent comparison of these models. The thesis is divided into theoretical and practical parts. The theoretical part introduces the field of web scraping, including ethical and legal aspects of web scraping. Furthermore, the domains of data mining, machi ne learning, neural networks and regression analysis principles are described. For each regression model, the theoretical basis, advantages, disadvantages, applicability and limitations in the real estate market are described. The practical part includes the application of web scraping, subsequent creation and preprocessing of dataset, use of individual prediction models, their evaluation and visualization. After the practical part of the paper, the individual results are discussed. Differences in the performance of each model, inter-comparisons and discussion of the suitability for practical use are discussed. Finally, the whole work is summarized, key contributions are highlighted, and possible future extensions are outlined. |
Keywords: |
regression analysis; machine learning; web scraping; CRISP-DM; Feature Extraction |
Information about study
Study programme: |
Aplikovaná informatika |
Type of study programme: |
Bakalářský studijní program |
Assigned degree: |
Bc. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: |
3. 1. 2025 |
Date of submission: |
12. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.