Identification of bots following Czech political accounts on Twitter

Thesis title: Identifikace botů na Twitteru u českých politických účtů
Author: Málek, Matěj
Thesis type: Diplomová práce
Supervisor: Böhmová, Lucie
Opponents: Pavlíček, Antonín
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá problematikou politické manipulace na sociálních sítích pomocí automatizovaných účtů, známých také pod názvem "boti". Hlavním cílem této práce je identifikovat současný stav botů, kteří sledují české politické profily na sociální síti Twitter. V této práci je pomocí modelu, vytvořeného prostřednictvím technik strojového učení, vycházejících z metodiky CRISP-DM, zkoumáno, jak moc působení botů ovlivňuje účty předních českých politiků na sociální síti Twitter. Bylo využito API Twitteru pro sběr dat všech sledujících profilů představitelů 5 největších českých politických stran. Tato data byla klasifikována rozhodovacím stromem vytvořeným pomocí algoritmů strojového učení a byly tak zjištěny pravděpodobné počty automatizovaných účtů. Pro kontrolu správnosti výstupů byly výsledky klasifikace porovnány s komerční službou se stejným účelem. Výsledkem této práce je rozhodovací strom pro identifikaci botů, pomocí kterého bylo zjištěno, že se podíl botů sledujících politické účty pohybuje mezi 11,9 a 20,9 %, což jsou v porovnání s~ostatními výzkumy lehce nadprůměrné hodnoty. Na závěr této práce je představeno srovnání vlastních výsledků s ostatními podobnými výzkumy a diskuse faktorů specifických pro české prostředí sociální sítě Twitter.
Keywords: sociální síť; bot; falešný sledující; Twitter; manipulace
Thesis title: Identification of bots following Czech political accounts on Twitter
Author: Málek, Matěj
Thesis type: Diploma thesis
Supervisor: Böhmová, Lucie
Opponents: Pavlíček, Antonín
Thesis language: Česky
Abstract:
This diploma thesis deals with the issue of political manipulation on social networks using automated accounts, also known as "bots". The main goal of this work is to identify the~current state of bots following Czech political profiles on the social network Twitter. This work examines whether, despite technological evolution in the field of false automated accounts, a~model created using machine learning techniques based on CRISP-DM methodology will be functional solution for their identification and whether this model will be able to compete with commercial services built for this purpose. The Twitter API was used to collect data from all profiles following representatives of the 5 largest Czech political parties. These data were classified by a decision tree created using machine learning algorithms and the probable numbers of automated accounts were determined. The result of this work is a decision tree for the identification of bot accounts, by which was found that the share of bots following political accounts is between 11.9 and 20.9 %. At~the end of this work, a comparison of own results with other similar research and a discussion of~factors specific to the Czech environment of the social network Twitter is presented.
Keywords: Twitter; Bot; Fake Follower; Social Network; Manipulation

Information about study

Study programme: Aplikovaná informatika/Informační management
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Systems Analysis

Information on submission and defense

Date of assignment: 18. 6. 2019
Date of submission: 3. 5. 2021
Date of defense: 2. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/70038/podrobnosti

Files for download

    Last update: