Public web platform for data integration and providing of football player statistics
Thesis title: | Veřejná webová platforma pro integraci dat a poskytování statistik fotbalových hráčů |
---|---|
Author: | Tkačenko, Dmitrij |
Thesis type: | Diplomová práce |
Supervisor: | Nguyen, Viet Bach |
Opponents: | Vojíř, Stanislav |
Thesis language: | Česky |
Abstract: | Diplomová práce se zabývá analýzou, návrhem a následnou implementací veřejné webové platformy, která integruje data a poskytuje statistiky všech fotbalistů a fotbalistek hrajících v~České Republice. Hlavním cílem je poskytnout užitečná a~zajímavá data o~jakémkoliv hráči pomocí veřejné webové platformy. Díky sekundárnímu výzkumu a dotazníkovému šetření jsou zjištěny požadavky hráčů, trenérů, skautů a dalších osob z fotbalového prostředí. Výzkum se věnuje způsobu užití dat a jejich obsahu. Rešerše vybraných šesti existujících systémů s~fotbalovými daty ukazuje, že chybí požadovaná data o českých hráčích hrajících různé úrovně a kategorie soutěží. Na základě provedené analýzy je navržena a implementována webová platforma, která extrahuje, zpracovává a ukládá data o~fotbalistech všech úrovní v~České republice. Kvůli absenci automatického přístupu k datům o~utkáních, využilo se pro extrakci dat web scrapingu. Nakonec je vytvořeno veřejné API, které publikuje data a~statistiky českých hráčů. Vytvořená platforma není v rámci této práce optimalizovaná pro zpracování veškerých členů a utkání včetně historie starší dvou let a následného odbavení desítky tisíc požadavků za minutu. Je však na ní ověřena možnost vytvoření a fungování takové webové platformy, která může být dále vyvíjena. Dalším vývojem a optimalizací je schopná v reálném čase nabízet aktuální statistiky a rozvoj hráčů v~čase na všech fotbalových úrovních. |
Keywords: | extrakce dat; webová aplikace; fotbal; web scraping; data fotbalových hráčů |
Thesis title: | Public web platform for data integration and providing of football player statistics |
---|---|
Author: | Tkačenko, Dmitrij |
Thesis type: | Diploma thesis |
Supervisor: | Nguyen, Viet Bach |
Opponents: | Vojíř, Stanislav |
Thesis language: | Česky |
Abstract: | The diploma thesis deals with the analysis, design and implementation of a public web platform, which integrates data and provides statistics of all football players playing in the Czech Republic. The main goal is to provide useful and interesting data about any player using a public web platform. Thanks to secondary research and questionnaire surveys, player's requirements are identified, coaches, scouts and other persons from the football environment. The research focuses on how the data is used and its content. A review of a selected six existing football data systems shows, that there is a lack of required data on Czech players playing at different levels and categories of competitions. Based on the analysis, a web-based platform is designed and implemented, that extracts, transforms and stores data on football players of all levels in the Czech Republic. Due to the lack of automatic access to match data, web scraping was used for data extraction. Finally, a public API is created that publishes data and statistics of Czech players. The created platform is not optimized for processing all members and matches, including history older than two years, and then handling tens of thousands of requests per minute. However, it is used to verify the possibility of creating and operating such a web platform, which can be further developed. With further development and optimization, it is able to offer real-time statistics and player development over time at all football levels. |
Keywords: | web scraping; web application; football; data extraction; football players data |
Information about study
Study programme: | Znalostní a webové technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 23. 10. 2021 |
---|---|
Date of submission: | 2. 5. 2022 |
Date of defense: | 1. 6. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/78505/podrobnosti |