Automatické vyhodnocování výročních zpráv firem z hlediska zelených úvěrů

Název práce: Automatické vyhodnocování výročních zpráv firem z hlediska zelených úvěrů
Autor(ka) práce: Pinterová, Lucie
Typ práce: Diplomová práce
Vedoucí práce: Máša, Petr
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá problematikou automatizovaného vyhodnocování firemních reportů pro potřeby hodnocení zelených úvěrů. V kontextu rostoucího významu udržitelného financování a regulatorních požadavků EU roste v bankách potřeba efektivního získávání ESG ukazatelů, které jsou ale v praxi často dostupné pouze ve výročních zprávách a zprávách o udržitelnosti. Cílem práce je navrhnout a ověřit přístup k automatizované extrakci vybraných ukazatelů EU taxonomie z těchto dokumentů. V rámci řešení byly analyzovány dva přístupy, tradiční pravidlový přístup a moderní přístup založený na využití velkých jazykových modelů (LLM). Práce zahrnuje návrh metodiky, implementaci řešení v jazyce Python a jeho vyhodnocení na datasetu reálných firemních reportů. Výsledky ukazují, že pravidlový přístup naráží na limity spojené s variabilitou dokumentů a složitostí formátu PDF. Naopak přístup využívající LLM dosahuje vysoké přesnosti extrakce. Nejlepší testovaná varianta správně extrahovala 98 % sledovaných údajů a u 65 % dokumentů byly všechny požadované ukazatele získány bez chyb. Současně došlo k snížení časové a nákladové náročnosti procesu oproti manuálnímu zpracování. Práce potvrzuje, že využití LLM představuje efektivní nástroj pro automatizaci zpracování dokumentů ve finančním sektoru a může přispět ke zefektivnění procesů spojených s hodnocením udržitelnosti a zeleného financování. Součástí práce je kód v jazyce Python, který umožňuje replikaci a další rozvoj navrženého postupu.
Klíčová slova: zelené úvěry; EU taxonomie; firemní reporty; velké jazykové modely; extrakce informací
Název práce: Automatické vyhodnocování výročních zpráv firem z hlediska zelených úvěrů
Autor(ka) práce: Pinterová, Lucie
Typ práce: Diploma thesis
Vedoucí práce: Máša, Petr
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
This thesis focuses on the automated evaluation of corporate reports for the purposes of green loan assessment. In the context of the growing importance of sustainable finance and EU regulatory requirements, banks increasingly need to efficiently obtain ESG indicators, which are often available only in annual reports and sustainability reports. The aim of this thesis is to design and evaluate an approach for the automated extraction of selected EU Taxonomy indicators from these documents. Two approaches are analyzed: a traditional rule-based approach and a modern approach based on large language models (LLMs). The proposed solution includes the design of a methodology, its implementation in Python, and evaluation on a dataset of real corporate reports. The results show that the rule-based approach faces significant limitations due to the variability of documents and the complexity of the PDF format. In contrast, the LLM-based approach achieves high extraction accuracy. The best-performing configuration correctly extracted 98% of the monitored indicators, and for 65% of the documents all required indicators were extracted without errors. At the same time, a significant reduction in time and cost requirements compared to manual processing was achieved. The thesis confirms that the use of LLMs represents an effective tool for automating document processing in the financial sector and can contribute to more efficient processes related to sustainability assessment and green financing. The thesis also includes a Python implementation that enables replication and further development of the proposed approach.
Klíčová slova: large language models; corporate reports; green loans; information extraction; EU Taxonomy

Informace o studiu

Studijní program / obor: Podniková informatika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 12. 1. 2026
Datum podání práce: 4. 5. 2026
Datum obhajoby: 12. 6. 2026
Identifikátor v systému InSIS: https://insis.vse.cz/zp/95119/podrobnosti

Soubory ke stažení

    Poslední aktualizace: