Data mining na sociální síti X pomocí nástroje NodeXL

Název práce: Data mining na sociální síti X pomocí nástroje NodeXL
Autor(ka) práce: Šenk, Martin
Typ práce: Diplomová práce
Vedoucí práce: Syrovátková, Jana
Oponenti práce: Kubiš, Václav
Jazyk práce: Česky
Abstrakt:
Tématem této diplomové práce je vyhledávání a získávání dat ze sociální sítě X, a to od volby vhodného nástroje pro získání těchto dat, přes jejich prvotní analýzu, očištění a detailní analýzu, až po vyhodnocení. Jako vzor pro postup této práce byla zvolena metodika CRISP-DM, která byla následně poupravena pro potřeby této práce. Hlavním cílem této práce je vytvoření vzorového postupu pro získávání a zpracování dat ze sociální sítě X, který následně může sloužit pro navazující či obdobné práce s podobným cílem. Jako zvolený nástroj pro splnění tohoto cíle byl vybrán nástroj pro analýzu sociálních sítí NodeXL, který je nadstavbou programu Microsoft Excel. Dalším cílem je seznámení se s vybraným nástrojem NodeXL, a popsání způsobů jeho využití, aby případné další projekty mohly z těchto znalostí čerpat a usnadnit si svou vlastní práci. Třetím cílem je vybrání konkrétního subjektu jakožto tématu dat, se kterými se v této práci pracuje, a na ukázkových datech představit možné zpracování takovýchto dat. Po několika změnách byla jako téma zvolena videohra Baldur’s Gate 3, a konkrétní data byla získána ze sociální sítě X v podobě tweetů a jejich autorů z období od 1. 8. 2023 00:00 do 9. 8. 2023 00:00 pomocí nástroje NodeXL. Všechny tři cíle byly splněny a díky práci na nich byly získány užitečné poznatky pro obdobné projekty, které mohou použít i jiní.
Klíčová slova: Data mining; Baldurs Gate 3; NodeXL; Twitter; X; CRISP-DM
Název práce: Data mining on social network X using tool NodeXL
Autor(ka) práce: Šenk, Martin
Typ práce: Diploma thesis
Vedoucí práce: Syrovátková, Jana
Oponenti práce: Kubiš, Václav
Jazyk práce: Česky
Abstrakt:
The topic of this diploma thesis is the search and acquisition of data from the social network X, starting with the choice of a suitable tool for obtaining this data, through its initial analysis, cleaning and detailed analysis, to evaluation. As a model for the progress of this work was chosen the CRISP-DM methodology, which was subsequently modified for the needs of this work. The main goal of this work is to create a sample procedure for obtaining and processing data from the social network X, which can subsequently be used for follow-up or similar work with a similar goal. As the chosen tool to fulfill this goal was chosen the social network analysis tool NodeXL, which is an extension of the Microsoft Excel program. Another goal is to become familiar with the selected NodeXL tool and to describe how to use it, so that any other projects can draw on this knowledge and make their own work easier. The third goal is to select a specific subject as the topic of the data that is worked with in this work, and to present the possible processing of such data on sample data. After some changes, the video game Baldur's Gate 3 was chosen as the topic, and specific data was obtained from the X social network in the form of tweets and their authors from the period from 01. 08. 2023 00:00 to 09. 08. 2023 00:00 using tool NodeXL. All three goals were met, and useful knowledge was obtained thanks to the work on them that can be used by others for similar projects.
Klíčová slova: Data mining; Baldurs Gate 3; NodeXL; Twitter; X; CRISP-DM

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační management
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra systémové analýzy

Informace o odevzdání a obhajobě

Datum zadání práce: 30. 1. 2023
Datum podání práce: 27. 6. 2024
Datum obhajoby: 19. 9. 2024
Identifikátor v systému InSIS: https://insis.vse.cz/zp/75095/podrobnosti

Soubory ke stažení

    Poslední aktualizace: