Klasifikace fake news na datech z Twitteru
Název práce: | Klasifikace fake news na datech z Twitteru |
---|---|
Autor(ka) práce: | Dumnov, Kirill |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Smutný, Zdeněk |
Jazyk práce: | Česky |
Abstrakt: | Šíření dezinformací na platformách sociálních médií, zejména na Twitteru, představuje pro veřejnou diskusi značnou výzvu. Táto práce představuje klasifikační systém pro identifikaci dezinformačních tweetů využívající algoritmy zpracování přirozeného jazyka (NLP). Systém integruje modely strojového učení, jako jsou rekurentní neuronové sítě (RNN), logistická regrese a Random Forest, s technikami NLP včetně lemmatizace a tokenizace. Řešením problémů, jako je rozmanitost dezinformací, kvalita a množství trénovacích dat a spoléhání se pouze na jazykové rysy, navrhovaný klasifikační systém demonstruje svůj potenciál pro detekci dezinformačních tweetů. Experimentální vyhodnocení ukazuje účinnost systému při identifikaci dezinformací a naznačuje jeho potenciál pro zmírnění šíření dezinformací na platformách sociálních médií a posílení veřejného diskurzu. |
Klíčová slova: | dezinformace; NLP; detekce Fake News; twitter |
Název práce: | Classification of fake news on Twitter data |
---|---|
Autor(ka) práce: | Dumnov, Kirill |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Smutný, Zdeněk |
Jazyk práce: | Česky |
Abstrakt: | The spread of misinformation on social media platforms, particularly Twitter, poses a significant challenge to public debate. This paper presents a classification system for identifying misinformation tweets using Natural Language Processing (NLP) algorithms. The system integrates machine learning models such as Recurrent Neural Networks (RNN), Logistic Regression and Random Forest with NLP techniques including lemmatization and tokenization. By addressing issues such as the diversity of misinformation, the quality and quantity of training data, and the reliance on linguistic features alone, the proposed classification system demonstrates its potential for detecting misinformation tweets. Experimental evaluation showcases the system's effectiveness in identifying misinformation, suggesting its potential to mitigate the spread of misinformation on social media platforms and enhance public discourse. |
Klíčová slova: | NLP; misinformation; fake news classification; twitter |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 3. 6. 2022 |
---|---|
Datum podání práce: | 7. 5. 2023 |
Datum obhajoby: | 12. 6. 2023 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/80858/podrobnosti |