Optimalizace kategorizace kreditních plateb

Název práce: Optimization of Categorization of Card Payments
Autor(ka) práce: Dohová, Simona
Typ práce: Diploma thesis
Vedoucí práce: Umlauf, Miroslav
Oponenti práce: Kotuč, Aleš
Jazyk práce: English
Abstrakt:
This master's thesis focuses on identifying similarities between the names of uncategorized merchants and those already categorized, using various similarity metrics and evaluating their effectiveness. After selecting the most suitable metric, it explores methods for categorizing these similar merchants. First, it explores the suitability of a classification model using NLP (Natural Language Processing) for text vector representation. Additionally, it explores solutions using more advanced methods such as transformers. The analysis is conducted on real-world data from the largest financial institution in the Czech Republic. Its main purpose is to increase the coverage of categorized merchants to provide bank customers with a better understanding of their expenses.
Klíčová slova: Machine Learning; Natural Language Preprocessing; Categorization of Payments; Transformers; Similarity metrics
Název práce: Optimalizace kategorizace kreditních plateb
Autor(ka) práce: Dohová, Simona
Typ práce: Diplomová práce
Vedoucí práce: Umlauf, Miroslav
Oponenti práce: Kotuč, Aleš
Jazyk práce: English
Abstrakt:
Tato diplomová práce se zaměřuje na identifikaci podobností mezi názvy nezařazených a již zařazených obchodníků s využitím různých metrik podobnosti a hodnotí jejich efektivitu. Po výběru nejvhodnější metriky jsou zkoumány metody pro kategorizaci těchto podobných obchodníků. Nejprve je analyzována vhodnost klasifikačního modelu využívajícího metody zpracování přirozeného jazyka (NLP) pro vektorovou reprezentaci textu. Následně jsou zvažována pokročilejší řešení, jako jsou modely typu transformer. Analýza je provedena na reálných datech od největší finanční instituce v České republice. Hlavním cílem práce je zvýšit pokrytí zařazených obchodníků a poskytnout zákazníkům banky lepší přehled o jejich výdajích.
Klíčová slova: Zpracování přirozeného jazyka; Metriky podobnosti; Kategorizace plateb; Strojové učení; Transformery

Informace o studiu

Studijní program / obor: Data a analytika pro business
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 1. 4. 2025
Datum podání práce: 5. 5. 2025
Datum obhajoby: 6. 6. 2025
Identifikátor v systému InSIS: https://insis.vse.cz/zp/92059/podrobnosti

Soubory ke stažení

    Poslední aktualizace: