Automatická detekce sarkasmu, přístupy, možnosti, techniky
Název práce: | Automatická detekce sarkasmu, přístupy, možnosti, techniky |
---|---|
Autor(ka) práce: | Čekan, Josef |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Jelínek, Ivan |
Oponenti práce: | Strossa, Petr |
Jazyk práce: | Česky |
Abstrakt: | Práce se zabývá automatickou detekcí sarkasmu v rámci sentiment analýzy textu. Pro detekcisarkasmu je nejprve důležité definovat samotný sarkasmus a jeho znaky a charakteristiky,což je učiněno v první části této práce. Následující část je věnována možnostemzisku vzorků dat a jejich formám. Tyto vzorky dat jsou klíčové při trénování a testovánímodelů určených k detekci sarkasmu. Dalším cílem práce bylo představení hlavních studiívěnujících se detekci sarkasmu, a to jak z hlediska použitých metod a přístupů, takz hlediska trendů, které v mladém odvětví automatické detekce sarkasmu panovaly a panují.V praktické části je vytvořen model, určený k detekci sarkasmu nad českými daty. Nejprvetedy byl sestaven vzorek ohodnocených českých dat. Následně byly pomocí trénovacísady dat a nástroje Apache DoccatTrainer vytvořeny modely pro detekci sarkasmus různými parametry. Poté byly tyto modely otestovány testovací sadou dat a vyhodnocenyvýsledky. Nejúspěšnější model dosáhl úspěšnosti 75 %, avšak přesnost určení sarkasmučinila pouze 37,5 %. |
Klíčová slova: | Sarkasmus; Dataset; Apache Doccat; Sentiment analýza |
Název práce: | Automatic sarcasm detection, approaches, possibilities, techniques |
---|---|
Autor(ka) práce: | Čekan, Josef |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Jelínek, Ivan |
Oponenti práce: | Strossa, Petr |
Jazyk práce: | Česky |
Abstrakt: | This thesis deals with the automatic detection of sarcasm within the sentiment analysis. Forthe detection of sarcasm, first it is important to define the sarcasm itself and its featuresand characteristics, which is done in the first part of this work. The following section isdevoted to the possibilities of obtaining data samples and their forms. These data samplesare key for training and testing models designed for sarcasm detection. Another aim of thework was to present the main studies on the automatic detection of sarcasm, both in termsof methods and approaches used, and in terms of the trends in this young sector of automaticdetection of sarcasm. A model is created in the practical part, designed to detect sarcasmover Czech data. First of all, a collection of evaluated Czech data was created.Subsequently, models for the detection of sarcasm with different parameters were createdusing the training set and Apache DoccatTrainer. These models were tested by a test datasetand the results were evaluated. The most successful model achieved a 75 % successrate, but the precision of sarcasm determination was only 37.5 %. |
Klíčová slova: | Sarcasm; Apache Doccat; Sentiment analysis; Dataset |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 1. 4. 2017 |
---|---|
Datum podání práce: | 27. 4. 2018 |
Datum obhajoby: | 12. 6. 2018 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/61897/podrobnosti |