Využití statistických metod ve hře League of Legends

Název práce: Využití statistických metod ve hře League of Legends
Autor(ka) práce: Jirka, Jan
Typ práce: Diplomová práce
Vedoucí práce: Čabla, Adam
Oponenti práce: Malá, Ivana
Jazyk práce: Česky
Abstrakt:
Diplomová práce si klade dva hlavní cíle: vytvoření prediktivních modelů pro predikci výsledků profesionální zápasy videohry League of Legends a obohacení datasetu profesionálních zápasů o další datové zdroje. První část práce se věnuje webscrapingu dostupných zdrojů pro získání hráčských přezdívek profesionálních hráčů. Obohacení dat z profesionálních bylo založeno na třech zdrojích, ze kterých se podařilo získat hráčské přezdívky 77 % profesionálních hráčů lig LEC, LCK, LCS a LPL. Data z profesionálních a rekreačních zápasů jsou agregována a transformována pro modelování. V rámci modelování jsou porovnány metody náhodných lesů a k-nejbližších sousedů při využívání různých přístupů rozdělení dat pro testovací účely. Na základě testovacích kritérií se při využívání testovacího datasetu za pomoci metody náhodných lesů podařilo získat model, který za celou dobu modelování dokázal správně určit výsledek v 54,67 % zápasů. Model náhodných lesů bez testovacího datasetu dokázal za stejné období správně určit 57,72 % zápasů. Z analýzy důležitosti skupin proměnných bylo zjištěno, že nejdůležitějšími skupinami jsou hráčské statistiky v lize a hráčské statistiky v solo queue. Analýzy a datové transformace byly provedeny za pomocí jazyku Python.
Klíčová slova: metoda hlavních komponent; web scraping; k-nejbližších sousedů; League of Legends; náhodné lesy
Název práce: Use of statistical methods in the game League of Legends
Autor(ka) práce: Jirka, Jan
Typ práce: Diploma thesis
Vedoucí práce: Čabla, Adam
Oponenti práce: Malá, Ivana
Jazyk práce: Česky
Abstrakt:
This diploma thesis has two main objectives; the creation of predictive models used for predicting of outcomes of professional matches played in the videogame League Of Legends, and the enhancement of professional match datasets using additional data sources. The first part of this thesis is dedicated to the act of web scraping of selected sources in order to get professional players' in-game nicknames. Data enhancement is based on three main data sources. 77 % of all professional players' nicknames from the LEC, LCK, LCS and LPL leagues is obtained from these sources. Data from professional and recreational matches is aggregated and transformed for use in modeling. The methods of random forests and k-Nearest Neighbors are compared using different approaches to partitioning data for test purposes. Using certain test criteria and random forests, a model is obtained which is able to correctly determine the outcome of 54,67 % of matches. A random forest model which does not use a test dataset is able to correctly determine the outcome of 57,72 % of matches from the same timeframe. Analysis of grouped variable importance is conducted, during which two groups with the highest importance are identified – one such group is the player statistics in a specific league, the other is player statistics in solo queue. Analyses and transformations are carried out in Python programming language.
Klíčová slova: random forest; web scraping; k-nearest neighbors; League of Legends; principal component analysis

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Statistika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 11. 12. 2019
Datum podání práce: 30. 6. 2022
Datum obhajoby: 23. 8. 2022
Identifikátor v systému InSIS: https://insis.vse.cz/zp/71941/podrobnosti

Soubory ke stažení

    Poslední aktualizace: