Identification of bots following Czech political accounts on Twitter
Thesis title: | Identifikace botů na Twitteru u českých politických účtů |
---|---|
Author: | Málek, Matěj |
Thesis type: | Diplomová práce |
Supervisor: | Böhmová, Lucie |
Opponents: | Pavlíček, Antonín |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá problematikou politické manipulace na sociálních sítích pomocí automatizovaných účtů, známých také pod názvem "boti". Hlavním cílem této práce je identifikovat současný stav botů, kteří sledují české politické profily na sociální síti Twitter. V této práci je pomocí modelu, vytvořeného prostřednictvím technik strojového učení, vycházejících z metodiky CRISP-DM, zkoumáno, jak moc působení botů ovlivňuje účty předních českých politiků na sociální síti Twitter. Bylo využito API Twitteru pro sběr dat všech sledujících profilů představitelů 5 největších českých politických stran. Tato data byla klasifikována rozhodovacím stromem vytvořeným pomocí algoritmů strojového učení a byly tak zjištěny pravděpodobné počty automatizovaných účtů. Pro kontrolu správnosti výstupů byly výsledky klasifikace porovnány s komerční službou se stejným účelem. Výsledkem této práce je rozhodovací strom pro identifikaci botů, pomocí kterého bylo zjištěno, že se podíl botů sledujících politické účty pohybuje mezi 11,9 a 20,9 %, což jsou v porovnání s~ostatními výzkumy lehce nadprůměrné hodnoty. Na závěr této práce je představeno srovnání vlastních výsledků s ostatními podobnými výzkumy a diskuse faktorů specifických pro české prostředí sociální sítě Twitter. |
Keywords: | sociální síť; bot; falešný sledující; Twitter; manipulace |
Thesis title: | Identification of bots following Czech political accounts on Twitter |
---|---|
Author: | Málek, Matěj |
Thesis type: | Diploma thesis |
Supervisor: | Böhmová, Lucie |
Opponents: | Pavlíček, Antonín |
Thesis language: | Česky |
Abstract: | This diploma thesis deals with the issue of political manipulation on social networks using automated accounts, also known as "bots". The main goal of this work is to identify the~current state of bots following Czech political profiles on the social network Twitter. This work examines whether, despite technological evolution in the field of false automated accounts, a~model created using machine learning techniques based on CRISP-DM methodology will be functional solution for their identification and whether this model will be able to compete with commercial services built for this purpose. The Twitter API was used to collect data from all profiles following representatives of the 5 largest Czech political parties. These data were classified by a decision tree created using machine learning algorithms and the probable numbers of automated accounts were determined. The result of this work is a decision tree for the identification of bot accounts, by which was found that the share of bots following political accounts is between 11.9 and 20.9 %. At~the end of this work, a comparison of own results with other similar research and a discussion of~factors specific to the Czech environment of the social network Twitter is presented. |
Keywords: | Twitter; Bot; Fake Follower; Social Network; Manipulation |
Information about study
Study programme: | Aplikovaná informatika/Informační management |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Systems Analysis |
Information on submission and defense
Date of assignment: | 18. 6. 2019 |
---|---|
Date of submission: | 3. 5. 2021 |
Date of defense: | 2. 6. 2021 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/70038/podrobnosti |