Detekce anomalií v uživatelském feedbacku

Název práce: Detekce anomalií v uživatelském feedbacku
Autor(ka) práce: Pivec, Jan
Typ práce: Závěrečná práce - Institut celoživotního vzdělávání
Vedoucí práce: Vencovský, Filip
Oponenti práce: -
Jazyk práce: Česky
Abstrakt:
Tato práce se zaměřuje na detekci anomálií v uživatelské zpětné vazbě získané prostřednictvím odinstalačního dotazníku antivirové desktopové aplikace. Cílem je automatizovaně identifikovat komentáře, které se významně liší od běžného vzorce, a tím odhalit nové nebo přehlížené typy problémů. K analýze je využit přístup založený na metodice CRISP-DM, zahrnující předzpracování textu (čištění, lemmatizace, překlad), vektorizaci pomocí modelu TF-IDF a detekce anomálií je realizována kombinací algoritmů s jádrem v Isolation Forest a ensemble strategií. Práce zohledňuje také kombinaci více signálů (čas, segmentace uživatelů) a výsledky prezentuje formou vizualizací pro produktový tým.
Klíčová slova: detekce anomáli; zpětná vazba; odinstalace; NLP; antivirová aplikace; CRISP-DM; TF-IDF; segmentace uživatelů
Název práce: Anomaly Detection in User Feedback Data
Autor(ka) práce: Pivec, Jan
Typ práce: Závěrečná práce - Institut celoživotního vzdělávání
Vedoucí práce: Vencovský, Filip
Oponenti práce: -
Jazyk práce: Česky
Abstrakt:
This thesis focuses on anomaly detection in user feedback collected via the uninstallation survey of an antivirus desktop application. The goal is to automatically identify comments that significantly deviate from common patterns in order to reveal new or overlooked issues. The analysis follows the CRISP-DM methodology and includes text preprocessing (cleaning, lemmatization, translation), vectorization using TF-IDF; anomaly detection is implemented with Isolation Forest within an ensemble strategy. The approach also incorporates additional signals such as timestamp, and user segmentation, and presents the results through visual dashboards for product teams.
Klíčová slova: antivirus application; uninstallation; NLP; CRISP-DM; anomaly detection; TF-IDF; user segmentation; feedback

Informace o studiu

Studijní program / obor: Data & Analytics for Business Management
Typ studijního programu: Celoživotní vzdělávání studijní program
Přidělovaná hodnost: MBA
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 1. 2. 2025
Datum podání práce: 13. 12. 2025
Datum obhajoby: 2026

Soubory ke stažení

Soubory budou k dispozici až po obhajobě práce.

    Poslední aktualizace: