Use of statistical methods in the game League of Legends
Thesis title: | Využití statistických metod ve hře League of Legends |
---|---|
Author: | Jirka, Jan |
Thesis type: | Diplomová práce |
Supervisor: | Čabla, Adam |
Opponents: | Malá, Ivana |
Thesis language: | Česky |
Abstract: | Diplomová práce si klade dva hlavní cíle: vytvoření prediktivních modelů pro predikci výsledků profesionální zápasy videohry League of Legends a obohacení datasetu profesionálních zápasů o další datové zdroje. První část práce se věnuje webscrapingu dostupných zdrojů pro získání hráčských přezdívek profesionálních hráčů. Obohacení dat z profesionálních bylo založeno na třech zdrojích, ze kterých se podařilo získat hráčské přezdívky 77 % profesionálních hráčů lig LEC, LCK, LCS a LPL. Data z profesionálních a rekreačních zápasů jsou agregována a transformována pro modelování. V rámci modelování jsou porovnány metody náhodných lesů a k-nejbližších sousedů při využívání různých přístupů rozdělení dat pro testovací účely. Na základě testovacích kritérií se při využívání testovacího datasetu za pomoci metody náhodných lesů podařilo získat model, který za celou dobu modelování dokázal správně určit výsledek v 54,67 % zápasů. Model náhodných lesů bez testovacího datasetu dokázal za stejné období správně určit 57,72 % zápasů. Z analýzy důležitosti skupin proměnných bylo zjištěno, že nejdůležitějšími skupinami jsou hráčské statistiky v lize a hráčské statistiky v solo queue. Analýzy a datové transformace byly provedeny za pomocí jazyku Python. |
Keywords: | metoda hlavních komponent; web scraping; k-nejbližších sousedů; League of Legends; náhodné lesy |
Thesis title: | Use of statistical methods in the game League of Legends |
---|---|
Author: | Jirka, Jan |
Thesis type: | Diploma thesis |
Supervisor: | Čabla, Adam |
Opponents: | Malá, Ivana |
Thesis language: | Česky |
Abstract: | This diploma thesis has two main objectives; the creation of predictive models used for predicting of outcomes of professional matches played in the videogame League Of Legends, and the enhancement of professional match datasets using additional data sources. The first part of this thesis is dedicated to the act of web scraping of selected sources in order to get professional players' in-game nicknames. Data enhancement is based on three main data sources. 77 % of all professional players' nicknames from the LEC, LCK, LCS and LPL leagues is obtained from these sources. Data from professional and recreational matches is aggregated and transformed for use in modeling. The methods of random forests and k-Nearest Neighbors are compared using different approaches to partitioning data for test purposes. Using certain test criteria and random forests, a model is obtained which is able to correctly determine the outcome of 54,67 % of matches. A random forest model which does not use a test dataset is able to correctly determine the outcome of 57,72 % of matches from the same timeframe. Analysis of grouped variable importance is conducted, during which two groups with the highest importance are identified – one such group is the player statistics in a specific league, the other is player statistics in solo queue. Analyses and transformations are carried out in Python programming language. |
Keywords: | random forest; web scraping; k-nearest neighbors; League of Legends; principal component analysis |
Information about study
Study programme: | Kvantitativní metody v ekonomice/Statistika |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Statistics and Probability |
Information on submission and defense
Date of assignment: | 11. 12. 2019 |
---|---|
Date of submission: | 30. 6. 2022 |
Date of defense: | 23. 8. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/71941/podrobnosti |