Analýza realitního trhu USA

Název práce: Analýza realitního trhu USA
Autor(ka) práce: Sachek, Herman
Typ práce: Bachelor thesis
Vedoucí práce: Berka, Petr
Oponenti práce: Kliegr, Tomáš
Jazyk práce: English
Abstrakt:
The aim of this bachelor's thesis is to collect data on the residential real estate market in the United States through web scraping and to analyze it using exploratory data analysis and data mining techniques in order to identify patterns, relationships between attributes, and regional differences within the market. The theoretical part introduces the field of Knowledge Discovery in Databases (KDD) and explains key concepts, including its definition, historical development, main process steps, and the CRISP-DM methodology. It also explores the topic of web scraping, covering its definition, applications, and the techniques used, such as static HTML parsing and dynamic content extraction. The practical part follows the CRISP-DM framework and applies it to the analysis of the U.S. real estate market. It begins with business understanding, including the selection of a relevant data source and the choice of cities for extraction. Data is collected using web scraping and prepared through the Data Understanding and Data Preparation phases. Finally, exploratory data analysis (EDA) and modeling techniques are applied to uncover insights from the dataset.
Klíčová slova: web scraping; data analysis; Data mining
Název práce: Analýza realitního trhu USA
Autor(ka) práce: Sachek, Herman
Typ práce: Bakalářská práce
Vedoucí práce: Berka, Petr
Oponenti práce: Kliegr, Tomáš
Jazyk práce: English
Abstrakt:
Cílem této bakalářské práce je shromáždit data o trhu rezidenčních nemovitostí ve Spojených státech pomocí web scrapingu a analyzovat je s využitím explorační analýzy dat a technik data miningu za účelem identifikace vzorců, vztahů mezi atributy a regionálních rozdílů na trhu. Teoretická část představuje oblast Dobývání Znalostí z Databáze a vysvětluje klíčové pojmy, včetně její definice, historického vývoje, hlavních kroků procesu a metodologie CRISP-DM. Dále se zabývá tématem web scrapingu, jeho definicí, využitím a technikami, jako je statické parsování HTML nebo extrakce dynamického obsahu. Praktická část se řídí metodologií CRISP-DM a je aplikována na analýzu trhu nemovitostí v USA. Začíná fází porozumění podnikatelskému cíli (business understanding), včetně výběru vhodného zdroje dat a měst pro sběr dat. Data jsou získána pomocí web scrapingu a následně připravena v rámci fází Data Understanding a Data Preparation. Nakonec jsou aplikovány metody explorační analýzy dat a modelování za účelem odhalení poznatků z datové sady.
Klíčová slova: Data mining; web scrapping; datová analýza

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 3. 5. 2024
Datum podání práce: 12. 5. 2025
Datum obhajoby: 18. 6. 2025
Identifikátor v systému InSIS: https://insis.vse.cz/zp/88377/podrobnosti

Soubory ke stažení

    Poslední aktualizace: