Data mining in Python

Thesis title: Data mining v jazyce Python
Author: Vlasák, Matěj
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Berka, Petr
Thesis language: Česky
Abstract:
Tato bakalářská práce se zabývá tématem data miningu. V teoretické části je popsán termín data mining společné s metodami, které využívá. Následně je popsán vybraný nástroj, konkrétně programovací jazyk Python, společně s knihovnami, které rozšiřují jeho schopnosti a umožňují jeho použití při dobývání znalostí z databází. Společně s ním jsou uvedeny další nástroje, které je možné pro řešení úlohy použít. V praktické části je demonstrováno nasazení nástroje na reálná data, která mají podobu nabídek služby AirBnB v Praze. Praktická část je rozdělena do tří fází. Nejprve je datová sada popsána a předzpracována, následuje exploratorní analýza. Poslední fází je nasazení modelů s cílem predikce ceny a cenových kategorií a zhodnocení výsledků celého procesu.
Keywords: Klasifikace; Predikce; Dobývání znalostí z databází; Python; Pandas; Data mining
Thesis title: Data mining in Python
Author: Vlasák, Matěj
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Berka, Petr
Thesis language: Česky
Abstract:
This bachelor thesis is focused on explaining concepts of data mining. First part of the work is focused on theoretical aspects of data mining and it’s principles and methods. Part of that is describing tools, that can be used for data mining with Python programing language described in detail along with it’s libraries. Second part is practical and demonstrates usage of data mining methods on real data. For that was chosen dataset containing AirBnB listings in Prague. This part has three stages, first is data preprocesing followed by exploratory analysis. In last part regression and classification models are being applied on dataset with focus on predicting price or price category.
Keywords: Knowledge discovery in databases; Pandas; Data mining; Classification; Prediction; Python

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 20. 12. 2019
Date of submission: 14. 12. 2020
Date of defense: 2. 2. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/72030/podrobnosti

Files for download

    Last update: