Porovnanie dataminingových algoritmov pri analýze trhu s nehnuteľnosťami
Název práce: | Porovnanie dataminingových algoritmov pri analýze trhu s nehnuteľnosťami |
---|---|
Autor(ka) práce: | Hrušovská, Daniela |
Typ práce: | Diplomová práce |
Vedoucí práce: | Pecáková, Iva |
Oponenti práce: | Řezanková, Hana |
Jazyk práce: | Slovensky |
Abstrakt: | Diplomová práca sa venuje štatistickým a dataminingovým algoritmom v oblasti nehnuteľností. Jednotlivé dáta, v celkovom počte 25 889 pozorovaní, predstavujú inzeráty na predaj bytov a domov, ktoré boli publikované od októbra 2020 do marca 2021. Pomocou modelov ako viacrozmerná regresná analýza, regresné spliny, rozhodovacie stromy, náhodné lesy a gradient boosting machine odhadujeme cenu nehnuteľností. Tvorba modelov prebieha na trénovacej množine dát a ich vyhodnotenie na testovacej. Práca je rozdelená na tri časti. V prvej sa nachádza teória k jednotlivým algoritmom a druhá časť je zameraná na dáta, ich spracovanie a základnú jednorozmernú analýzu. Tretia časť obsahuje modely cien nehnuteľností v podobe štyroch úloh, kde je rozdelenie na byty verzus domy a hlavné mesto Praha verzus republika. V diplomovej práci sledujeme dva ciele. Prvým z nich je analýza trhu nehnuteľnosti pomocou sledovaných premenných a stanovenie ich vplyvu na cenu. Druhým cieľom je tvorba modelov prostredníctvom spomenutých algoritmov v programovacom jazyku R a určenie, ktorý z nich je najvhodnejší z pohľadu predpovede ceny nehnuteľnosti. |
Klíčová slova: | náhodné lesy; gradient boosting machine; nehnuteľnosti; regresia; regresné spliny; rozhodovacie stromy |
Název práce: | Porovnanie dataminingových algoritmov pri analýze trhu s nehnuteľnosťami |
---|---|
Autor(ka) práce: | Hrušovská, Daniela |
Typ práce: | Diplomová práce |
Vedoucí práce: | Pecáková, Iva |
Oponenti práce: | Řezanková, Hana |
Jazyk práce: | Slovensky |
Abstrakt: | Diplomová práce se věnuje statistickým a dataminingovým algoritmům v oblasti nemovitostí. Jednotlivá data, v celkovém počtu 25 889 pozorování, představují inzeráty na prodej bytů a domů, které byly publikovány od října 2020 do března 2021. Pomocí modelů jako vícerozměrná regresní analýza, regresní spliny, rozhodovací stromy, náhodné lesy a gradient boosting machine odhadujeme cenu nemovitostí. Tvorba modelů probíhá na trénovací množině dat a jejich vyhodnocení na testovací. Práce je rozdělena na tři části. V první se nachází teorie k jednotlivým algoritmům a druhá část je zaměřena na data, jejich zpracování a základní jednorozměrnou analýzu. Třetí část obsahuje modely cen nemovitostí v podobě čtyř úkolů, kde je rozdělení na byty versus domy a Prahu versus republiku. V diplomové práci sledujeme dva cíle. Prvním z nich je analýza trhu nemovitosti pomocí sledovaných proměnných a stanovení jejich vlivu na cenu. Druhým cílem je tvorba modelů prostřednictvím zmíněných algoritmů v programovacím jazyce R a určení, který z nich je nejvhodnější z pohledu předpovědi ceny nemovitosti. |
Klíčová slova: | nemovitosti; rozhodovací stromy; regrese; regresní spliny; náhodné lesy; gradient boosting machine |
Název práce: | Comparison of data mining algorithms in real estate market analysis |
---|---|
Autor(ka) práce: | Hrušovská, Daniela |
Typ práce: | Diploma thesis |
Vedoucí práce: | Pecáková, Iva |
Oponenti práce: | Řezanková, Hana |
Jazyk práce: | Slovensky |
Abstrakt: | The diploma thesis is focused on statistical and data mining algorithms in the real estate market. Individual data, in total of 25 889 observations, represent apartment and house sales advertisements that were published between October 2020 and March 2021. Using models such as multidimensional regression analysis, regression splines, decision trees, random forests and gradient boosting machine, we estimate property prices. The creation of models takes place on a training dataset and their evaluation on a test dataset. The work is divided into three parts. The first one contains a theory of individual algorithms. The second part is focused on data, their processing and basic one-dimensional analysis. The third part contains models of real estate prices in the form of four tasks, where the division is into apartments versus houses and capital city Prague versus the republic. In the diploma thesis we pursue two goals. The first is the analysis of the real estate market using the monitored variables and determining their impact on the price. The second goal is to create models using the mentioned algorithms in the programming language R and to determine which of them is the most suitable regarding the real estate price estimation. |
Klíčová slova: | properties; regression; regression splines; decision trees; random forests; gradient boosting machine |
Informace o studiu
Studijní program / obor: | Kvantitativní metody v ekonomice/Statistika |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 2. 9. 2019 |
---|---|
Datum podání práce: | 3. 12. 2021 |
Datum obhajoby: | 3. 2. 2022 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/70325/podrobnosti |