Implementation of Artificial Neural networks in Java for Classification of False News

Thesis title: Použití umělých neuronových sítí v Javě pro úlohu rozpoznání falešných zpráv
Author: Vávra, Marek
Thesis type: Bakalářská práce
Supervisor: Zamazal, Ondřej
Opponents: Vacura, Miroslav
Thesis language: Česky
Abstract:
Umělé neuronové sítě se v poslední době dostávají do popředí zájmu v oblasti strojového učení. Používání konvolučních a rekurentních architektur umožnuje jejich efektivní použití v různých úlohách dolování z dat. Jednou z úloh je i klasifikace falešných zpráv, jejichž prudký nárůst v posledních letech vedl k nutnosti nalezení nových metod, jak je klasifikovat a zabránit jejich šíření. Touto oblastí se zaobírá i tato práce a má několik cílů. V teoretické rovině jsou jimi představení oblasti dolování z dat (data mining), představení umělých (hlubokých) neuronových sítí obecně a v prostředí Javy a představení aplikační oblasti. Tyto cíle jsou řešeny rešerší související literatury. V teoretické části práce je nejdříve vymezena oblast dolování z dat, následují umělé neuronové sítě a jejich implementace v Javě. V závěru teoretické části je představena aplikační oblast falešných zpráv. Praktickými cíli práce jsou navrhnout a realizovat model umělé neuronové sítě v Javě pro klasifikační úlohu z aplikační oblasti falešných zpráv a porovnat a vyhodnotit dosažené výsledky oproti dalším vybraným metodám z dobývání znalostí z databází. Realizovány byly modely využívající konvoluční a rekurentní architektury. Pro implementaci byla použita knihovna Deeplearning4j v programovacím jazyce Java. Praktická část se zaobírá nutnými kroky předzpracování dat pro použití v neuronových sítích. Navazuje návrh a realizace použitých modelů pro klasifikaci falešných zpráv. Jedná se o 3 různé rekurentní modely a 2 konvoluční. Na závěr jsou výsledky klasifikace porovnány s výsledky vybraných metod dobývání znalostí z databází. Pro tuto klasifikační úlohy dosahovaly lepších výsledků rekurentní modely s úspěšností 75%, konvoluční modely dosáhly úspěšnosti klasifikace 68%.
Keywords: rekurentní neuronová síť; Deeplearning4j; konvoluční neuronová síť; umělé neuronové sítě; falešné zprávy; klasifikace textu
Thesis title: Implementation of Artificial Neural networks in Java for Classification of False News
Author: Vávra, Marek
Thesis type: Bachelor thesis
Supervisor: Zamazal, Ondřej
Opponents: Vacura, Miroslav
Thesis language: Česky
Abstract:
In recent years, artificial neural networks established themselves as a key component of machine learning. Recurrent and convolutional architectures enabled their usage for wide variety of problem. Classification of fake news is one of those problems and a theme of this work. Five different goal were set up for this thesis, three theoretical and two practical. Theoretical goals are to introduce field of data mining, to introduce deep neural networks and their implementation in Java environment and to introduce fake news. This is done by research of related literature. The theoretical part of the thesis first defines the area of data mining, followed by artificial neural networks and their implementation in Java. At the end of the theoretical part, the application area of false news is presented. Practical goals are to design and implement model of artificial neural network able to classify fake news, implemented in Java and to compare results with result of other selected methods used in data mining. The practical part of this thesis first deals with the necessary steps of data pre-processing enabling use in neural networks. Then models using convolutional and recurrent architectures are presented. In total there are five models, three recurrent and two convolutional. In the end of the thesis, result of these models are compared to results of other selected methods. For this classification task, recurrent models achieved better results with a success rate of 75%, convolution models achieved a success rate of 68%.
Keywords: fake news; Deeplearning4j; Artificial neural networks; text classification; convolutional neural network; recurrent neural network

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 7. 10. 2019
Date of submission: 11. 5. 2020
Date of defense: 16. 6. 2020
Identifier in the InSIS system: https://insis.vse.cz/zp/69280/podrobnosti

Files for download

    Last update: