Data mining v jazyce Python

Název práce: Data mining v jazyce Python
Autor(ka) práce: Vlasák, Matěj
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Berka, Petr
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zabývá tématem data miningu. V teoretické části je popsán termín data mining společné s metodami, které využívá. Následně je popsán vybraný nástroj, konkrétně programovací jazyk Python, společně s knihovnami, které rozšiřují jeho schopnosti a umožňují jeho použití při dobývání znalostí z databází. Společně s ním jsou uvedeny další nástroje, které je možné pro řešení úlohy použít. V praktické části je demonstrováno nasazení nástroje na reálná data, která mají podobu nabídek služby AirBnB v Praze. Praktická část je rozdělena do tří fází. Nejprve je datová sada popsána a předzpracována, následuje exploratorní analýza. Poslední fází je nasazení modelů s cílem predikce ceny a cenových kategorií a zhodnocení výsledků celého procesu.
Klíčová slova: Klasifikace; Predikce; Dobývání znalostí z databází; Python; Pandas; Data mining
Název práce: Data mining in Python
Autor(ka) práce: Vlasák, Matěj
Typ práce: Bachelor thesis
Vedoucí práce: Chudán, David
Oponenti práce: Berka, Petr
Jazyk práce: Česky
Abstrakt:
This bachelor thesis is focused on explaining concepts of data mining. First part of the work is focused on theoretical aspects of data mining and it’s principles and methods. Part of that is describing tools, that can be used for data mining with Python programing language described in detail along with it’s libraries. Second part is practical and demonstrates usage of data mining methods on real data. For that was chosen dataset containing AirBnB listings in Prague. This part has three stages, first is data preprocesing followed by exploratory analysis. In last part regression and classification models are being applied on dataset with focus on predicting price or price category.
Klíčová slova: Knowledge discovery in databases; Pandas; Data mining; Classification; Prediction; Python

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 20. 12. 2019
Datum podání práce: 14. 12. 2020
Datum obhajoby: 2. 2. 2021
Identifikátor v systému InSIS: https://insis.vse.cz/zp/72030/podrobnosti

Soubory ke stažení

    Poslední aktualizace: