Využití data miningu pro analýzu pedagogických výkonů na VŠE
Název práce: | Využití data miningu pro analýzu pedagogických výkonů na VŠE |
---|---|
Autor(ka) práce: | Prokop, Jonáš |
Typ práce: | Diplomová práce |
Vedoucí práce: | Kučera, Jan |
Oponenti práce: | Chlapek, Dušan |
Jazyk práce: | Česky |
Abstrakt: | Tato diplomová práce se zabývá využitím data miningu v kontextu akademického prostředí. S narůstajícími objemy dat je pro získávání relevantních informací nutné přistupovat ke stále složitějším metodám analýzy, a to jak v podnikové, tak v akademické sféře. Instituce v obou sférách tak stále častěji aplikují metody data miningu, aby odhalily souvislosti svého vnitřního fungování a dosáhly jeho zefektivnění. Prvním cílem práce je definování úloh analýzy pedagogických výkonů na Vysoké škole ekonomické v Praze (VŠE) založené na využití data miningu za pomoci rešerše literatury. V rešerši je nastíněný momentální stav data miningu v akademickém prostředí a možnosti jeho využití obecně a konkrétně pro data pedagogických výkonů VŠE. Druhým cílem je následné vypracování dvou takových úloh na základě poznatků zjištěných rešerší. Tyto úlohy jsou zaměřeny na rozložení studentů v rámci jednotlivých akcí vypisovaných na VŠE. První obecněji analyzuje trendy v počtech studentů na akcích v kontextu dat o výuce VŠE. Druhá sleduje procentní obsazenost akcí v kontextu dat o registracích předmětů VŠE. Pro každou úlohu jsou za pomoci aplikace na přípravu a analýzu dat, vytvořené v jazyce Python, připraveny datové sady. Ty jsou vytvářeny na základě dat pedagogických výkonů na VŠE dostupných z databáze o výkonech VŠE a z excelových exportů z informačního systému VŠE InSIS. V rámci této aplikace je pak na jednotlivé datové sady pro každou úlohu aplikován k-means clustering, hierarchický clustering a model sebe-organizujících map. Tím jsou získána rozložení skupin předmětů ve sledovaných parametrech, která jsou následně podrobně popsána. Celá analýza je nakonec od výběru parametrů až po rozložení samotných výsledků znázorněna na vizualizacích. |
Klíčová slova: | edukativní data mining; data mining ; pokročilá analýza; Python |
Název práce: | Utilizing data mining for the analysis of pedagogical performance at VŠE |
---|---|
Autor(ka) práce: | Prokop, Jonáš |
Typ práce: | Diploma thesis |
Vedoucí práce: | Kučera, Jan |
Oponenti práce: | Chlapek, Dušan |
Jazyk práce: | Česky |
Abstrakt: | This master thesis concerns itself with the use of data mining in the context of academic environment. With the generally increasing volumes of data, it is more often necessary to resort to more complex methods to obtain valuable insight from data. This applies to both corporate and academic spheres. Institutions in both spheres are thus increasingly applying methods of data mining with the aim of uncovering the inner workings of their own organizations and by doing so improving their efficiency. The first objective of the thesis is to define the tasks of analyzing pedagogical performance at University of Economics, Prague (VŠE) through a comprehensive literature review. The review outlines the current state of data mining in the academic environment, exploring its potential applications in general and specifically for VŠE pedagogical performance data. The second objective of the thesis is to subsequently develop two such tasks based on the insight obtained from the literature review. These tasks focus on the distribution of students within various classes organized at VŠE. First task is analyzing trends in numbers of students in the context of data focused mainly on subject teaching on VŠE. The second task is analyzing class occupancy in the context of data focused mainly on subject registrations on VŠE. Both tasks utilize a Python-based data preparation and analysis application for processing datasets derived from VŠE pedagogical performance data. This data is available both from VŠE performance database and Excel exports from VŠE information system, InSIS. Subsequently within the application k-means clustering, hierarchical clustering and self-organizing map models are applied to individual datasets created for each of the two tasks. This yields cluster distributions of subjects based on the observed parameters, which are then described. The entire analysis from parameter selection to distribution of results is in the end depicted through visualizations. |
Klíčová slova: | educational data mining; data mining; advanced analysis; Python |
Informace o studiu
Studijní program / obor: | Data a analytika pro business |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 4. 11. 2022 |
---|---|
Datum podání práce: | 29. 4. 2024 |
Datum obhajoby: | 31. 5. 2024 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/82647/podrobnosti |