Emails and another usage of bayesian filters

Thesis title: Dopisy v Internetu a další používání bayesovských filtrů
Author: Červenka, Richard
Thesis type: Diplomová práce
Supervisor: Kastl, Jan
Opponents: Veselá, Bohumila
Thesis language: Česky
Abstract:
Tato diplomová práce se zaměřuje na využití bayesovských filtrů. Bayesovské filtry jsou využívány především jako obranný mechanismus v boji s nevyžádanou poštou. Cílem této práce je pokusně vyzkoušet, zda tyto filtry mohou fungovat nejen pro emailovou komunikaci, ale i pro rozlišování webových stránek. Úvodní část poskytuje základní informace o boji proti nevyžádané poště. Především se zaměřuje na metodu boje za pomoci bayesovských filtrů, které jsou podrobněji rozpracovány s jednoduchým příkladem. Druhá stěžejní polovina práce se zaměřuje na vlastní pokus, kde jsou experimentálně analyzovány možnosti rozlišování webových stránek za pomoci bayesovského filtru na legitimní a spamové. Dále se zabývá možností třídění webových stránek do více kategorií, než jsou pouze legitimní a spamové stránky. Oba experimenty jsou podrobně popsány včetně všech využitých nástrojů.
Keywords: Bayesovský filtr; Webový katalog; Spam
Thesis title: Emails and another usage of bayesian filters
Author: Červenka, Richard
Thesis type: Diploma thesis
Supervisor: Kastl, Jan
Opponents: Veselá, Bohumila
Thesis language: Česky
Abstract:
This diploma thesis deals with usage of bayesian filtres. Bayesian filters are used especially as defensive mechanism in fight with unsolicited emails. The main aim is to try whether these filters may operate not only with emails but also on behalf of web pages distinction. The introductory part provides basic information about fight against unsolicited emails. Above all is mentioned bayesian fighting method that is more detailed developed with simple example. The second fundamental half is focusing on attempt where are experimentally analyzed possibilities of web pages distinction with the aid of bayesian filter into legitimate and spam pages. Furthermore it handles with possibility web pages sorting into several categories more than only into legitimate and spam. Both experiments are described in detail and it includes descriptions of all used tools.
Keywords: Bayesian filter; Spam; Web catalogue

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 1. 4. 2008
Date of submission: 31. 12. 2008
Date of defense: 8. 6. 2009
Identifier in the InSIS system: https://insis.vse.cz/zp/13162/podrobnosti

Files for download

    Last update: