Klasifikace fake news na datech z Twitteru

Název práce: Klasifikace fake news na datech z Twitteru
Autor(ka) práce: Dumnov, Kirill
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Smutný, Zdeněk
Jazyk práce: Česky
Abstrakt:
Šíření dezinformací na platformách sociálních médií, zejména na Twitteru, představuje pro veřejnou diskusi značnou výzvu. Táto práce představuje klasifikační systém pro identifikaci dezinformačních tweetů využívající algoritmy zpracování přirozeného jazyka (NLP). Systém integruje modely strojového učení, jako jsou rekurentní neuronové sítě (RNN), logistická regrese a Random Forest, s technikami NLP včetně lemmatizace a tokenizace. Řešením problémů, jako je rozmanitost dezinformací, kvalita a množství trénovacích dat a spoléhání se pouze na jazykové rysy, navrhovaný klasifikační systém demonstruje svůj potenciál pro detekci dezinformačních tweetů. Experimentální vyhodnocení ukazuje účinnost systému při identifikaci dezinformací a naznačuje jeho potenciál pro zmírnění šíření dezinformací na platformách sociálních médií a posílení veřejného diskurzu.
Klíčová slova: dezinformace; NLP; detekce Fake News; twitter
Název práce: Classification of fake news on Twitter data
Autor(ka) práce: Dumnov, Kirill
Typ práce: Bachelor thesis
Vedoucí práce: Chudán, David
Oponenti práce: Smutný, Zdeněk
Jazyk práce: Česky
Abstrakt:
The spread of misinformation on social media platforms, particularly Twitter, poses a significant challenge to public debate. This paper presents a classification system for identifying misinformation tweets using Natural Language Processing (NLP) algorithms. The system integrates machine learning models such as Recurrent Neural Networks (RNN), Logistic Regression and Random Forest with NLP techniques including lemmatization and tokenization. By addressing issues such as the diversity of misinformation, the quality and quantity of training data, and the reliance on linguistic features alone, the proposed classification system demonstrates its potential for detecting misinformation tweets. Experimental evaluation showcases the system's effectiveness in identifying misinformation, suggesting its potential to mitigate the spread of misinformation on social media platforms and enhance public discourse.
Klíčová slova: NLP; misinformation; fake news classification; twitter

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 3. 6. 2022
Datum podání práce: 7. 5. 2023
Datum obhajoby: 12. 6. 2023
Identifikátor v systému InSIS: https://insis.vse.cz/zp/80858/podrobnosti

Soubory ke stažení

    Poslední aktualizace: