Use of statistical methods in the game League of Legends

Thesis title: Využití statistických metod ve hře League of Legends
Author: Jirka, Jan
Thesis type: Diplomová práce
Supervisor: Čabla, Adam
Opponents: Malá, Ivana
Thesis language: Česky
Abstract:
Diplomová práce si klade dva hlavní cíle: vytvoření prediktivních modelů pro predikci výsledků profesionální zápasy videohry League of Legends a obohacení datasetu profesionálních zápasů o další datové zdroje. První část práce se věnuje webscrapingu dostupných zdrojů pro získání hráčských přezdívek profesionálních hráčů. Obohacení dat z profesionálních bylo založeno na třech zdrojích, ze kterých se podařilo získat hráčské přezdívky 77 % profesionálních hráčů lig LEC, LCK, LCS a LPL. Data z profesionálních a rekreačních zápasů jsou agregována a transformována pro modelování. V rámci modelování jsou porovnány metody náhodných lesů a k-nejbližších sousedů při využívání různých přístupů rozdělení dat pro testovací účely. Na základě testovacích kritérií se při využívání testovacího datasetu za pomoci metody náhodných lesů podařilo získat model, který za celou dobu modelování dokázal správně určit výsledek v 54,67 % zápasů. Model náhodných lesů bez testovacího datasetu dokázal za stejné období správně určit 57,72 % zápasů. Z analýzy důležitosti skupin proměnných bylo zjištěno, že nejdůležitějšími skupinami jsou hráčské statistiky v lize a hráčské statistiky v solo queue. Analýzy a datové transformace byly provedeny za pomocí jazyku Python.
Keywords: metoda hlavních komponent; web scraping; k-nejbližších sousedů; League of Legends; náhodné lesy
Thesis title: Use of statistical methods in the game League of Legends
Author: Jirka, Jan
Thesis type: Diploma thesis
Supervisor: Čabla, Adam
Opponents: Malá, Ivana
Thesis language: Česky
Abstract:
This diploma thesis has two main objectives; the creation of predictive models used for predicting of outcomes of professional matches played in the videogame League Of Legends, and the enhancement of professional match datasets using additional data sources. The first part of this thesis is dedicated to the act of web scraping of selected sources in order to get professional players' in-game nicknames. Data enhancement is based on three main data sources. 77 % of all professional players' nicknames from the LEC, LCK, LCS and LPL leagues is obtained from these sources. Data from professional and recreational matches is aggregated and transformed for use in modeling. The methods of random forests and k-Nearest Neighbors are compared using different approaches to partitioning data for test purposes. Using certain test criteria and random forests, a model is obtained which is able to correctly determine the outcome of 54,67 % of matches. A random forest model which does not use a test dataset is able to correctly determine the outcome of 57,72 % of matches from the same timeframe. Analysis of grouped variable importance is conducted, during which two groups with the highest importance are identified – one such group is the player statistics in a specific league, the other is player statistics in solo queue. Analyses and transformations are carried out in Python programming language.
Keywords: random forest; web scraping; k-nearest neighbors; League of Legends; principal component analysis

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 11. 12. 2019
Date of submission: 30. 6. 2022
Date of defense: 23. 8. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/71941/podrobnosti

Files for download

    Last update: