Analýza realitního trhu USA
Název práce: | Analýza realitního trhu USA |
---|---|
Autor(ka) práce: | Sachek, Herman |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Berka, Petr |
Oponenti práce: | Kliegr, Tomáš |
Jazyk práce: | English |
Abstrakt: | The aim of this bachelor's thesis is to collect data on the residential real estate market in the United States through web scraping and to analyze it using exploratory data analysis and data mining techniques in order to identify patterns, relationships between attributes, and regional differences within the market. The theoretical part introduces the field of Knowledge Discovery in Databases (KDD) and explains key concepts, including its definition, historical development, main process steps, and the CRISP-DM methodology. It also explores the topic of web scraping, covering its definition, applications, and the techniques used, such as static HTML parsing and dynamic content extraction. The practical part follows the CRISP-DM framework and applies it to the analysis of the U.S. real estate market. It begins with business understanding, including the selection of a relevant data source and the choice of cities for extraction. Data is collected using web scraping and prepared through the Data Understanding and Data Preparation phases. Finally, exploratory data analysis (EDA) and modeling techniques are applied to uncover insights from the dataset. |
Klíčová slova: | web scraping; data analysis; Data mining |
Název práce: | Analýza realitního trhu USA |
---|---|
Autor(ka) práce: | Sachek, Herman |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Berka, Petr |
Oponenti práce: | Kliegr, Tomáš |
Jazyk práce: | English |
Abstrakt: | Cílem této bakalářské práce je shromáždit data o trhu rezidenčních nemovitostí ve Spojených státech pomocí web scrapingu a analyzovat je s využitím explorační analýzy dat a technik data miningu za účelem identifikace vzorců, vztahů mezi atributy a regionálních rozdílů na trhu. Teoretická část představuje oblast Dobývání Znalostí z Databáze a vysvětluje klíčové pojmy, včetně její definice, historického vývoje, hlavních kroků procesu a metodologie CRISP-DM. Dále se zabývá tématem web scrapingu, jeho definicí, využitím a technikami, jako je statické parsování HTML nebo extrakce dynamického obsahu. Praktická část se řídí metodologií CRISP-DM a je aplikována na analýzu trhu nemovitostí v USA. Začíná fází porozumění podnikatelskému cíli (business understanding), včetně výběru vhodného zdroje dat a měst pro sběr dat. Data jsou získána pomocí web scrapingu a následně připravena v rámci fází Data Understanding a Data Preparation. Nakonec jsou aplikovány metody explorační analýzy dat a modelování za účelem odhalení poznatků z datové sady. |
Klíčová slova: | Data mining; web scrapping; datová analýza |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 3. 5. 2024 |
---|---|
Datum podání práce: | 12. 5. 2025 |
Datum obhajoby: | 18. 6. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/88377/podrobnosti |