Optimalizace kategorizace kreditních plateb
Název práce: | Optimization of Categorization of Card Payments |
---|---|
Autor(ka) práce: | Dohová, Simona |
Typ práce: | Diploma thesis |
Vedoucí práce: | Umlauf, Miroslav |
Oponenti práce: | Kotuč, Aleš |
Jazyk práce: | English |
Abstrakt: | This master's thesis focuses on identifying similarities between the names of uncategorized merchants and those already categorized, using various similarity metrics and evaluating their effectiveness. After selecting the most suitable metric, it explores methods for categorizing these similar merchants. First, it explores the suitability of a classification model using NLP (Natural Language Processing) for text vector representation. Additionally, it explores solutions using more advanced methods such as transformers. The analysis is conducted on real-world data from the largest financial institution in the Czech Republic. Its main purpose is to increase the coverage of categorized merchants to provide bank customers with a better understanding of their expenses. |
Klíčová slova: | Machine Learning; Natural Language Preprocessing; Categorization of Payments; Transformers; Similarity metrics |
Název práce: | Optimalizace kategorizace kreditních plateb |
---|---|
Autor(ka) práce: | Dohová, Simona |
Typ práce: | Diplomová práce |
Vedoucí práce: | Umlauf, Miroslav |
Oponenti práce: | Kotuč, Aleš |
Jazyk práce: | English |
Abstrakt: | Tato diplomová práce se zaměřuje na identifikaci podobností mezi názvy nezařazených a již zařazených obchodníků s využitím různých metrik podobnosti a hodnotí jejich efektivitu. Po výběru nejvhodnější metriky jsou zkoumány metody pro kategorizaci těchto podobných obchodníků. Nejprve je analyzována vhodnost klasifikačního modelu využívajícího metody zpracování přirozeného jazyka (NLP) pro vektorovou reprezentaci textu. Následně jsou zvažována pokročilejší řešení, jako jsou modely typu transformer. Analýza je provedena na reálných datech od největší finanční instituce v České republice. Hlavním cílem práce je zvýšit pokrytí zařazených obchodníků a poskytnout zákazníkům banky lepší přehled o jejich výdajích. |
Klíčová slova: | Zpracování přirozeného jazyka; Metriky podobnosti; Kategorizace plateb; Strojové učení; Transformery |
Informace o studiu
Studijní program / obor: | Data a analytika pro business |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 1. 4. 2025 |
---|---|
Datum podání práce: | 5. 5. 2025 |
Datum obhajoby: | 6. 6. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/92059/podrobnosti |