Detekce anomalií v uživatelském feedbacku
| Název práce: | Detekce anomalií v uživatelském feedbacku |
|---|---|
| Autor(ka) práce: | Pivec, Jan |
| Typ práce: | Závěrečná práce - Institut celoživotního vzdělávání |
| Vedoucí práce: | Vencovský, Filip |
| Oponenti práce: | Zimmermann, Pavel |
| Jazyk práce: | Česky |
| Abstrakt: | Tato práce se zaměřuje na detekci anomálií v uživatelské zpětné vazbě získané prostřednictvím odinstalačního dotazníku antivirové desktopové aplikace. Cílem je automatizovaně identifikovat komentáře, které se významně liší od běžného vzorce, a tím odhalit nové nebo přehlížené typy problémů. K analýze je využit přístup založený na metodice CRISP-DM, zahrnující předzpracování textu (čištění, lemmatizace, překlad), vektorizaci pomocí modelu TF-IDF a detekce anomálií je realizována kombinací algoritmů s jádrem v Isolation Forest a ensemble strategií. Práce zohledňuje také kombinaci více signálů (čas, segmentace uživatelů) a výsledky prezentuje formou vizualizací pro produktový tým. |
| Klíčová slova: | detekce anomáli; zpětná vazba; odinstalace; NLP; antivirová aplikace; CRISP-DM; TF-IDF; segmentace uživatelů |
| Název práce: | Anomaly Detection in User Feedback Data |
|---|---|
| Autor(ka) práce: | Pivec, Jan |
| Typ práce: | Závěrečná práce - Institut celoživotního vzdělávání |
| Vedoucí práce: | Vencovský, Filip |
| Oponenti práce: | Zimmermann, Pavel |
| Jazyk práce: | Česky |
| Abstrakt: | This thesis focuses on anomaly detection in user feedback collected via the uninstallation survey of an antivirus desktop application. The goal is to automatically identify comments that significantly deviate from common patterns in order to reveal new or overlooked issues. The analysis follows the CRISP-DM methodology and includes text preprocessing (cleaning, lemmatization, translation), vectorization using TF-IDF; anomaly detection is implemented with Isolation Forest within an ensemble strategy. The approach also incorporates additional signals such as timestamp, and user segmentation, and presents the results through visual dashboards for product teams. |
| Klíčová slova: | antivirus application; uninstallation; NLP; CRISP-DM; anomaly detection; TF-IDF; user segmentation; feedback |
Informace o studiu
| Studijní program / obor: | Data & Analytics for Business Management |
|---|---|
| Typ studijního programu: | Celoživotní vzdělávání studijní program |
| Přidělovaná hodnost: | MBA |
| Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
| Fakulta: | Fakulta informatiky a statistiky |
| Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
| Datum zadání práce: | 1. 2. 2025 |
|---|---|
| Datum podání práce: | 13. 12. 2025 |
| Datum obhajoby: | 4. 3. 2026 |
| Identifikátor v systému InSIS: | https://insis.vse.cz/zp/94866/podrobnosti |