Prediction of student success using machine learning techniques

Thesis title: Predikce úspěšnosti studentů pomocí technik strojového učení
Author: Sanin, Oleksandr
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Strnad, Pavel
Thesis language: Česky
Abstract:
Cílem dané bakalářské práce je vytvoření klasifikačního modelu strojového učení na predikci úspěšností studentů v určité disciplíně nadcházejícího ročníku studia na základě údajů o jeho školních úspěších a známkách za první ročník vysokoškolského studia. Daná problematika je celosvětově na univerzitách velmi aktuální, vzhledem k vysoké úrovní studijní neúspěšnosti. Celá práce se dělí na dvě časti: teoretickou a praktickou. V rámci teoretické části je provedená rešerše základů strojového učení: typy a úlohy strojového učení, algoritmy a metriky v klasifikačních problémech. Následovně jsou popsány oblasti aplikace, možné problémy v implementaci a nevýhody. V rámci praktické části je implementován model strojového učení, který je navržen na základě datasetu, který obsahuje studijní výsledky studentů 1. ročníku studia let 2018/2019 ze dvou vzdělávacích oborů stejné fakulty. S využitím programovacího jazyka Python, je daný model transformován do maticové podoby, kde vždy jedna proměnná, kterou je třeba předpovědět, je cílová. Dále je testována řada modelů strojového učení, které zahrnují různé implementace lineární regrese, podpůrných vektorů a naivního bayesovského klasifikátoru. V závěru práce je provedeno porovnání přesnosti modelů a jsou vybrány dva nejpřesnější. Součástí závěru jsou zároveň detailně popsané vyhlídky na rozvoj klasifikátoru a další možné směřování práce. Cíle, které byly v rámci dané bakalářské práce definované, jsou úspěšně splněny. Je provedena analýza zkušeností s použitím strojového učení ve vzdělávacích postupech různými vzdělávacími institucemi. Výsledkem této práce je vytvoření klasifikačního modelů strojového učení, který umožňuje předpovídat úspěch studenta ve druhém ročníku, na základě údajů o jeho školních úspěších a známkách za první ročník vysokoškolského studia.
Keywords: automatizované strojové učení; LMS (Learning Management System); Python; klasifikace
Thesis title: Prediction of student success using machine learning techniques
Author: Sanin, Oleksandr
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Strnad, Pavel
Thesis language: Česky
Abstract:
The bachelor thesis aims to create a classification model of machine learning, that will predict the success of students in a particular discipline of the upcoming year of study, based on data of their school achievements and grades for the first year of university study. The issue is very relevant at universities worldwide, due to the high level of academic failure. The whole work is divided into two parts: theoretical and practical. Within the theoretical part, an exploration of the basics of machine learning is performed: types and tasks of machine learning, algorithms, and metrics in classification problems. Afterward, describes the areas of application, possible implementation problems, and disadvantages. Within the practical part, a machine learning model is developed. It’s designed based on a dataset, which contains the results of students of 1st year of study in 2018/2019 from two educational fields of the same faculty. Using the Python programming language, the model is transformed into an array form, where always one variable must be predicted as the target. Furthermore, a number of machine learning models are tested, which include various implementations of linear regression, support vectors, and a naive Bayesian classifier. At the end of the work, the accuracy of the models is compared, and the two most accurate ones are selected. Part of the conclusion is also describing in detail the prospects for the future development of the classifier and other possible directions of work. The goals that were defined in the bachelor thesis are successfully fulfilled. An analysis of the experience with the use of machine learning in educational procedures by various educational institutions is performed. The result of this work is the creation of classification models of machine learning, which allows predicting the success of a student in the second year, based on data of his school achievements and grades for the first year of university studies.
Keywords: automated machine learning; LMS (Learning Management System); Python; classification

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 16. 9. 2021
Date of submission: 12. 12. 2021
Date of defense: 2. 2. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/77777/podrobnosti

Files for download

    Last update: