Anomaly Detection in User Feedback Data
| Thesis title: | Detekce anomalií v uživatelském feedbacku |
|---|---|
| Author: | Pivec, Jan |
| Thesis type: | Závěrečná práce - Institut celoživotního vzdělávání |
| Supervisor: | Vencovský, Filip |
| Opponents: | Zimmermann, Pavel |
| Thesis language: | Česky |
| Abstract: | Tato práce se zaměřuje na detekci anomálií v uživatelské zpětné vazbě získané prostřednictvím odinstalačního dotazníku antivirové desktopové aplikace. Cílem je automatizovaně identifikovat komentáře, které se významně liší od běžného vzorce, a tím odhalit nové nebo přehlížené typy problémů. K analýze je využit přístup založený na metodice CRISP-DM, zahrnující předzpracování textu (čištění, lemmatizace, překlad), vektorizaci pomocí modelu TF-IDF a detekce anomálií je realizována kombinací algoritmů s jádrem v Isolation Forest a ensemble strategií. Práce zohledňuje také kombinaci více signálů (čas, segmentace uživatelů) a výsledky prezentuje formou vizualizací pro produktový tým. |
| Keywords: | detekce anomáli; zpětná vazba; odinstalace; NLP; antivirová aplikace; CRISP-DM; TF-IDF; segmentace uživatelů |
| Thesis title: | Anomaly Detection in User Feedback Data |
|---|---|
| Author: | Pivec, Jan |
| Thesis type: | Závěrečná práce - Institut celoživotního vzdělávání |
| Supervisor: | Vencovský, Filip |
| Opponents: | Zimmermann, Pavel |
| Thesis language: | Česky |
| Abstract: | This thesis focuses on anomaly detection in user feedback collected via the uninstallation survey of an antivirus desktop application. The goal is to automatically identify comments that significantly deviate from common patterns in order to reveal new or overlooked issues. The analysis follows the CRISP-DM methodology and includes text preprocessing (cleaning, lemmatization, translation), vectorization using TF-IDF; anomaly detection is implemented with Isolation Forest within an ensemble strategy. The approach also incorporates additional signals such as timestamp, and user segmentation, and presents the results through visual dashboards for product teams. |
| Keywords: | antivirus application; uninstallation; NLP; CRISP-DM; anomaly detection; TF-IDF; user segmentation; feedback |
Information about study
| Study programme: | Data & Analytics for Business Management |
|---|---|
| Type of study programme: | Celoživotní vzdělávání studijní program |
| Assigned degree: | MBA |
| Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
| Faculty: | Faculty of Informatics and Statistics |
| Department: | Department of Information Technologies |
Information on submission and defense
| Date of assignment: | 1. 2. 2025 |
|---|---|
| Date of submission: | 13. 12. 2025 |
| Date of defense: | 4. 3. 2026 |
| Identifier in the InSIS system: | https://insis.vse.cz/zp/94866/podrobnosti |