Data mining on social network X using tool NodeXL

Thesis title: Data mining na sociální síti X pomocí nástroje NodeXL
Author: Šenk, Martin
Thesis type: Diplomová práce
Supervisor: Syrovátková, Jana
Opponents: Kubiš, Václav
Thesis language: Česky
Abstract:
Tématem této diplomové práce je vyhledávání a získávání dat ze sociální sítě X, a to od volby vhodného nástroje pro získání těchto dat, přes jejich prvotní analýzu, očištění a detailní analýzu, až po vyhodnocení. Jako vzor pro postup této práce byla zvolena metodika CRISP-DM, která byla následně poupravena pro potřeby této práce. Hlavním cílem této práce je vytvoření vzorového postupu pro získávání a zpracování dat ze sociální sítě X, který následně může sloužit pro navazující či obdobné práce s podobným cílem. Jako zvolený nástroj pro splnění tohoto cíle byl vybrán nástroj pro analýzu sociálních sítí NodeXL, který je nadstavbou programu Microsoft Excel. Dalším cílem je seznámení se s vybraným nástrojem NodeXL, a popsání způsobů jeho využití, aby případné další projekty mohly z těchto znalostí čerpat a usnadnit si svou vlastní práci. Třetím cílem je vybrání konkrétního subjektu jakožto tématu dat, se kterými se v této práci pracuje, a na ukázkových datech představit možné zpracování takovýchto dat. Po několika změnách byla jako téma zvolena videohra Baldur’s Gate 3, a konkrétní data byla získána ze sociální sítě X v podobě tweetů a jejich autorů z období od 1. 8. 2023 00:00 do 9. 8. 2023 00:00 pomocí nástroje NodeXL. Všechny tři cíle byly splněny a díky práci na nich byly získány užitečné poznatky pro obdobné projekty, které mohou použít i jiní.
Keywords: Data mining; Baldurs Gate 3; NodeXL; Twitter; X; CRISP-DM
Thesis title: Data mining on social network X using tool NodeXL
Author: Šenk, Martin
Thesis type: Diploma thesis
Supervisor: Syrovátková, Jana
Opponents: Kubiš, Václav
Thesis language: Česky
Abstract:
The topic of this diploma thesis is the search and acquisition of data from the social network X, starting with the choice of a suitable tool for obtaining this data, through its initial analysis, cleaning and detailed analysis, to evaluation. As a model for the progress of this work was chosen the CRISP-DM methodology, which was subsequently modified for the needs of this work. The main goal of this work is to create a sample procedure for obtaining and processing data from the social network X, which can subsequently be used for follow-up or similar work with a similar goal. As the chosen tool to fulfill this goal was chosen the social network analysis tool NodeXL, which is an extension of the Microsoft Excel program. Another goal is to become familiar with the selected NodeXL tool and to describe how to use it, so that any other projects can draw on this knowledge and make their own work easier. The third goal is to select a specific subject as the topic of the data that is worked with in this work, and to present the possible processing of such data on sample data. After some changes, the video game Baldur's Gate 3 was chosen as the topic, and specific data was obtained from the X social network in the form of tweets and their authors from the period from 01. 08. 2023 00:00 to 09. 08. 2023 00:00 using tool NodeXL. All three goals were met, and useful knowledge was obtained thanks to the work on them that can be used by others for similar projects.
Keywords: Data mining; Baldurs Gate 3; NodeXL; Twitter; X; CRISP-DM

Information about study

Study programme: Aplikovaná informatika/Informační management
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Systems Analysis

Information on submission and defense

Date of assignment: 30. 1. 2023
Date of submission: 27. 6. 2024
Date of defense: 2024

Files for download

The files will be available after the defense of the thesis.

    Last update: