Anomaly Detection in User Feedback Data

Thesis title: Detekce anomalií v uživatelském feedbacku
Author: Pivec, Jan
Thesis type: Závěrečná práce - Institut celoživotního vzdělávání
Supervisor: Vencovský, Filip
Opponents: -
Thesis language: Česky
Abstract:
Tato práce se zaměřuje na detekci anomálií v uživatelské zpětné vazbě získané prostřednictvím odinstalačního dotazníku antivirové desktopové aplikace. Cílem je automatizovaně identifikovat komentáře, které se významně liší od běžného vzorce, a tím odhalit nové nebo přehlížené typy problémů. K analýze je využit přístup založený na metodice CRISP-DM, zahrnující předzpracování textu (čištění, lemmatizace, překlad), vektorizaci pomocí modelu TF-IDF a detekce anomálií je realizována kombinací algoritmů s jádrem v Isolation Forest a ensemble strategií. Práce zohledňuje také kombinaci více signálů (čas, segmentace uživatelů) a výsledky prezentuje formou vizualizací pro produktový tým.
Keywords: detekce anomáli; zpětná vazba; odinstalace; NLP; antivirová aplikace; CRISP-DM; TF-IDF; segmentace uživatelů
Thesis title: Anomaly Detection in User Feedback Data
Author: Pivec, Jan
Thesis type: Závěrečná práce - Institut celoživotního vzdělávání
Supervisor: Vencovský, Filip
Opponents: -
Thesis language: Česky
Abstract:
This thesis focuses on anomaly detection in user feedback collected via the uninstallation survey of an antivirus desktop application. The goal is to automatically identify comments that significantly deviate from common patterns in order to reveal new or overlooked issues. The analysis follows the CRISP-DM methodology and includes text preprocessing (cleaning, lemmatization, translation), vectorization using TF-IDF; anomaly detection is implemented with Isolation Forest within an ensemble strategy. The approach also incorporates additional signals such as timestamp, and user segmentation, and presents the results through visual dashboards for product teams.
Keywords: antivirus application; uninstallation; NLP; CRISP-DM; anomaly detection; TF-IDF; user segmentation; feedback

Information about study

Study programme: Data & Analytics for Business Management
Type of study programme: Celoživotní vzdělávání studijní program
Assigned degree: MBA
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 1. 2. 2025
Date of submission: 13. 12. 2025
Date of defense: 2026

Files for download

The files will be available after the defense of the thesis.

    Last update: