Použití umělé inteligence pro extrakci textu z dokumentů a jeho integraci do aplikace pro úvěrovou analýzu
Název práce: | Applying AI for Text Extraction from Documents and Its Integration into a Credit Analysis Application |
---|---|
Autor(ka) práce: | Harník, Martin |
Typ práce: | Diploma thesis |
Vedoucí práce: | Karkošková, Soňa |
Oponenti práce: | Potančok, Martin |
Jazyk práce: | English |
Abstrakt: | This thesis explores the use of artificial intelligence for automating data extraction from unstructured financial documents, with a focus on credit analysis reports in the banking sector. Credit analysts routinely produce detailed reports when evaluating loan applications, but the information contained in these documents is rarely reused due to a lack of structured integration. To address this inefficiency, the thesis develops and validates a proof-of-concept pipeline that extracts both structured and unstructured data from PDF documents and integrates it into a centralized SQL database that powers a credit analysis application. The solution combines Azure OpenAI GPT-4 Omni for processing free-text narratives with Azure AI Document Intelligence for extracting structured data. The thesis follows the CRISP-DM methodology and is contextualized using the three-axis maturity framework, which evaluates the organization’s readiness across analytics, data, and IT dimensions. The implementation is iteratively refined based on feedback from credit analysts, ensuring alignment with real-world workflows. The results demonstrate the feasibility and business value of integrating cognitive AI into document-heavy processes and lay the foundation for future expansion of AI capabilities within the bank’s credit risk management systems. |
Klíčová slova: | Azure AI Document Intelligence; Document processing; GPT-4 Omni; SQL; Data extraction |
Název práce: | Použití umělé inteligence pro extrakci textu z dokumentů a jeho integraci do aplikace pro úvěrovou analýzu |
---|---|
Autor(ka) práce: | Harník, Martin |
Typ práce: | Diplomová práce |
Vedoucí práce: | Karkošková, Soňa |
Oponenti práce: | Potančok, Martin |
Jazyk práce: | English |
Abstrakt: | Diplomová práce se zabývá využitím umělé inteligence k automatizaci extrakce dat z nestrukturovaných finančních dokumentů, se zaměřením na úvěrové analýzy v bankovním sektoru. Úvěroví analytici běžně vytvářejí podrobné zprávy při posuzování žádostí o úvěr, avšak informace obsažené v těchto dokumentech se kvůli absenci strukturované integrace jen zřídka dále využívají. Práce se proto snaží vytvořit prototyp systému, který extrahuje jak strukturovaná, tak nestrukturovaná data z PDF dokumentů a integruje je do centralizované SQL databáze, nad kterou běží samotná aplikace. Řešení kombinuje Azure OpenAI GPT-4 Omni pro zpracování textu a Azure AI Document Intelligence pro extrakci strukturovaných dat. Diplomová práce se řídí metodologií CRISP-DM a je zasazená do kontextu pomocí tříosé maturity frameworku, který hodnotí připravenost organizace v oblastech analytiky, dat a IT. Implementace je postupně vylepšována na základě zpětné vazby od úvěrových analytiků, aby bylo zajištěno sladění s reálnými pracovními procesy. Výsledky ukazují, že nasazení kognitivní umělé inteligence do procesů zpracování dokumentů je proveditelné a přináší hodnotu, a zároveň otevírají cestu k dalšímu rozvoji AI v systémech řízení úvěrového rizika banky. |
Klíčová slova: | Zpracování dokumentů; SQL; GPT-4 Omni; Azure AI Document Intelligence; Data extraction |
Informace o studiu
Studijní program / obor: | Data a analytika pro business |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 14. 11. 2024 |
---|---|
Datum podání práce: | 4. 5. 2025 |
Datum obhajoby: | 12. 6. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/90352/podrobnosti |