Virtual Image of the Czech Sports via Unstructured Data Analysis

Thesis title: Virtuální obraz českého sportu skrze analýzu nestrukturovaných dat
Author: Levý, Jan
Thesis type: Bakalářská práce
Supervisor: Jelínek, Ivan
Opponents: Profousová, Lenka
Thesis language: Česky
Abstract:
Analýza nestrukturovaných dat ze sociálních sítí patří mezi významné a stále se rozvíjející složky aplikace informačních technologií v marketingové praxi. Cíle práce zahrnují vytvoření testovací platformy pro analýzu nestrukturovaných dat ze sociální sítě Facebook, nalezení a aplikace metod a metrik pro analyzování těchto dat, shrnutí výsledků analýzy a vizualizace vybraných metrik pomocí ukázkového dashboardu. Struktura práce odpovídá metodám pro dosažení cílů a obsahuje sedm částí. První část shrnuje důvody, proč analyzovat data ze sociálních sítí, zkoumá přístupy k analýze sociálních sítí v současných vědeckých pracích a pojednává o komerčních nástrojích pro takovou analýzu. Druhá část rozebírá vytvoření přístupu k datovým zdrojům, strukturu vytvořených dokumentů a výběr vhodných datových zdrojů. Třetí část zpracovává téma použitých analytických nástrojů - Elasticsearch a Kibana. Čtvrtá část definuje některé otázky, které je možné si položit v rámci obrazu českého sportu na sociální síti Facebook. Pátá část určuje metriky pro vyhodnocení těchto otázek a popisuje potřebné filtrování dat. Šestá část se zaobírá samotnou analýzou a shrnuje její výsledky. Sedmá část ukazuje použití dashboardu z nástroje Kibana pro efektivní shrnování výsledků. Hlavním přínosem práce je ukázka možností analýzy sociálních sítí na příkladu obrazu českých sportovců a sportovních odvětví na síti Facebook. K analýze byl využit konektor pro stahování dat z Facebooku a nástroje Elasticsearch a Kibana, které umožnily data procházet, filtrovat a vizualizovat. Jednotlivými kroky analýzy bylo definování analytických otázek, dále definice analytických metod a metrik pro nalezení odpovědí, samotná analýza a shrnutí výsledků. Mezi nálezy analýzy patří určení sportovců s nejvyšším marketingovým potenciálem, seřazení analyzovaných sportů podle jejich obrazu mezi fanoušky a stanovení stránek s nejvíce navzájem interagujícími fanoušky.
Keywords: Analýza sentimentu; Facebook; Analýza sociálních sítí; Marketing sportovců; Analýza nestrukturovaných dat
Thesis title: Virtual Image of the Czech Sports via Unstructured Data Analysis
Author: Levý, Jan
Thesis type: Bachelor thesis
Supervisor: Jelínek, Ivan
Opponents: Profousová, Lenka
Thesis language: Česky
Abstract:
Analysis of unstructured data from social media is an important and constantly growing part of information technologies' application in the marketing context. The aims of this bachelors' thesis include creating a trial platform for the analysis of un-structured data from Facebook, research and application of suitable methods and metrics for the analysis, summarizing the analysis' findings and visualisation of selected metrics by means of a dashboard. The thesis' structure corresponds to the methods used for metting the aims set and compo-ses of seven parts. The first part summarizes motives for social media analysis, deals with the approach to the topic in the contemporary scientific papers and discusses comercial tools that could be used for such analysis. The second part describes gathering of data with a crawler, setting the connection and getting the access rights to the data sources. The structure of downloaded documents and appropriate choice of data sources is also described in this part. The third part adresses the tools used for the analysis, namely Elas-ticsearch and Kibana. The fourth part defines possible questions that may be asked in the context of Czech sports image on Facebook. The fifth part identifies the metrics necessary for the questions assesment and describes corresponding data selection. The sixth part completes the analysis itself and summarizes its findnings. The seventh part describes Ki-bana's dashboard use for effective summarizing of selected metrics. The main bachelors' thesis contribution lies in the illustration of social media analysis pos-sibilities on the example of Czech sportsmen and Czech sports in general on Facebook. A crawler has been used to gather the data for the purpose of the analysis. The other em-ployed tools included Elasticsearch and Kibana, which have enabled the data selection and visualisation. The analytical approach consisted of four parts; definition of analytical que-stions, definition of methods and metrics to find answers to these questions, followed by the analysis itself and the summary of results. The following points belong to the analysis' findnings: identification of sportsman with the highest marketing potential, comparison of analysed sports according to the perceived image by fans and desgination of the pages with most interacting followers.
Keywords: Opinion mining; Unstructured data analysis; Social media analysis; Sports marketing; Facebook

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 6. 2. 2015
Date of submission: 6. 5. 2015
Date of defense: 18. 6. 2015
Identifier in the InSIS system: https://insis.vse.cz/zp/51127/podrobnosti

Files for download

    Last update: