Data mining v jazyce Python
Název práce: | Data mining v jazyce Python |
---|---|
Autor(ka) práce: | Vlasák, Matěj |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Berka, Petr |
Jazyk práce: | Česky |
Abstrakt: | Tato bakalářská práce se zabývá tématem data miningu. V teoretické části je popsán termín data mining společné s metodami, které využívá. Následně je popsán vybraný nástroj, konkrétně programovací jazyk Python, společně s knihovnami, které rozšiřují jeho schopnosti a umožňují jeho použití při dobývání znalostí z databází. Společně s ním jsou uvedeny další nástroje, které je možné pro řešení úlohy použít. V praktické části je demonstrováno nasazení nástroje na reálná data, která mají podobu nabídek služby AirBnB v Praze. Praktická část je rozdělena do tří fází. Nejprve je datová sada popsána a předzpracována, následuje exploratorní analýza. Poslední fází je nasazení modelů s cílem predikce ceny a cenových kategorií a zhodnocení výsledků celého procesu. |
Klíčová slova: | Klasifikace; Predikce; Dobývání znalostí z databází; Python; Pandas; Data mining |
Název práce: | Data mining in Python |
---|---|
Autor(ka) práce: | Vlasák, Matěj |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Berka, Petr |
Jazyk práce: | Česky |
Abstrakt: | This bachelor thesis is focused on explaining concepts of data mining. First part of the work is focused on theoretical aspects of data mining and it’s principles and methods. Part of that is describing tools, that can be used for data mining with Python programing language described in detail along with it’s libraries. Second part is practical and demonstrates usage of data mining methods on real data. For that was chosen dataset containing AirBnB listings in Prague. This part has three stages, first is data preprocesing followed by exploratory analysis. In last part regression and classification models are being applied on dataset with focus on predicting price or price category. |
Klíčová slova: | Knowledge discovery in databases; Pandas; Data mining; Classification; Prediction; Python |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 20. 12. 2019 |
---|---|
Datum podání práce: | 14. 12. 2020 |
Datum obhajoby: | 2. 2. 2021 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/72030/podrobnosti |