Automatické vyhodnocování výročních zpráv firem z hlediska zelených úvěrů
| Název práce: | Automatické vyhodnocování výročních zpráv firem z hlediska zelených úvěrů |
|---|---|
| Autor(ka) práce: | Pinterová, Lucie |
| Typ práce: | Diplomová práce |
| Vedoucí práce: | Máša, Petr |
| Oponenti práce: | Chudán, David |
| Jazyk práce: | Česky |
| Abstrakt: | Tato diplomová práce se zabývá problematikou automatizovaného vyhodnocování firemních reportů pro potřeby hodnocení zelených úvěrů. V kontextu rostoucího významu udržitelného financování a regulatorních požadavků EU roste v bankách potřeba efektivního získávání ESG ukazatelů, které jsou ale v praxi často dostupné pouze ve výročních zprávách a zprávách o udržitelnosti. Cílem práce je navrhnout a ověřit přístup k automatizované extrakci vybraných ukazatelů EU taxonomie z těchto dokumentů. V rámci řešení byly analyzovány dva přístupy, tradiční pravidlový přístup a moderní přístup založený na využití velkých jazykových modelů (LLM). Práce zahrnuje návrh metodiky, implementaci řešení v jazyce Python a jeho vyhodnocení na datasetu reálných firemních reportů. Výsledky ukazují, že pravidlový přístup naráží na limity spojené s variabilitou dokumentů a složitostí formátu PDF. Naopak přístup využívající LLM dosahuje vysoké přesnosti extrakce. Nejlepší testovaná varianta správně extrahovala 98 % sledovaných údajů a u 65 % dokumentů byly všechny požadované ukazatele získány bez chyb. Současně došlo k snížení časové a nákladové náročnosti procesu oproti manuálnímu zpracování. Práce potvrzuje, že využití LLM představuje efektivní nástroj pro automatizaci zpracování dokumentů ve finančním sektoru a může přispět ke zefektivnění procesů spojených s hodnocením udržitelnosti a zeleného financování. Součástí práce je kód v jazyce Python, který umožňuje replikaci a další rozvoj navrženého postupu. |
| Klíčová slova: | zelené úvěry; EU taxonomie; firemní reporty; velké jazykové modely; extrakce informací |
| Název práce: | Automatické vyhodnocování výročních zpráv firem z hlediska zelených úvěrů |
|---|---|
| Autor(ka) práce: | Pinterová, Lucie |
| Typ práce: | Diploma thesis |
| Vedoucí práce: | Máša, Petr |
| Oponenti práce: | Chudán, David |
| Jazyk práce: | Česky |
| Abstrakt: | This thesis focuses on the automated evaluation of corporate reports for the purposes of green loan assessment. In the context of the growing importance of sustainable finance and EU regulatory requirements, banks increasingly need to efficiently obtain ESG indicators, which are often available only in annual reports and sustainability reports. The aim of this thesis is to design and evaluate an approach for the automated extraction of selected EU Taxonomy indicators from these documents. Two approaches are analyzed: a traditional rule-based approach and a modern approach based on large language models (LLMs). The proposed solution includes the design of a methodology, its implementation in Python, and evaluation on a dataset of real corporate reports. The results show that the rule-based approach faces significant limitations due to the variability of documents and the complexity of the PDF format. In contrast, the LLM-based approach achieves high extraction accuracy. The best-performing configuration correctly extracted 98% of the monitored indicators, and for 65% of the documents all required indicators were extracted without errors. At the same time, a significant reduction in time and cost requirements compared to manual processing was achieved. The thesis confirms that the use of LLMs represents an effective tool for automating document processing in the financial sector and can contribute to more efficient processes related to sustainability assessment and green financing. The thesis also includes a Python implementation that enables replication and further development of the proposed approach. |
| Klíčová slova: | large language models; corporate reports; green loans; information extraction; EU Taxonomy |
Informace o studiu
| Studijní program / obor: | Podniková informatika |
|---|---|
| Typ studijního programu: | Magisterský studijní program |
| Přidělovaná hodnost: | Ing. |
| Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
| Fakulta: | Fakulta informatiky a statistiky |
| Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
| Datum zadání práce: | 12. 1. 2026 |
|---|---|
| Datum podání práce: | 4. 5. 2026 |
| Datum obhajoby: | 12. 6. 2026 |
| Identifikátor v systému InSIS: | https://insis.vse.cz/zp/95119/podrobnosti |