Vyhodnocení a omezení ztráty informací v souhrnech článků o ověřování klimatických faktů vytvořených pomocí umělé inteligence

Název práce: Evaluation and Mitigation of Information Loss in AI Summaries of Climate Fact-Checking Articles
Autor(ka) práce: Zetek, Ondřej
Typ práce: Bachelor thesis
Vedoucí práce: Vencovský, Filip
Oponenti práce: Haniková, Kateřina
Jazyk práce: English
Abstrakt:
This bachelor’s thesis addresses the problem of efficiently processing long fact-check articles, the use case specifically focuses on climate related articles, while preserving factual correctness and transparency for end users. The work presents the design and implementation of an interactive web application that supports article fetching from a given URL address or manual text input, automatic summarization, and metric-oriented iterative refinement. The developed solution combines techniques for text fetching (including domain-aware parsing and fallback methods), preprocessing for textual noise removal, and summary generation with configurable output length. The user can regenerate summaries with length constraints and give feedback to the model, enabling control and insight into the summarization process itself. To assess summary quality beyond word overlap, the thesis integrates a multidimensional evaluation framework focused on data point coverage, dimensional completeness, and weighted coverage, as well as factuality proxies inspired by long-document evaluation research. The resulting system demonstrates that combining robust retrieval, user-guided summarization, and factuality-aware evaluation provides a practical and usable pipeline for climate fact-check summarization, and offers an option to trustworthy AI-assisted fact-checking workflows.
Klíčová slova: long-document summarization; interactive summarization; dimensional evaluation metrics; explainable fact-checking; climate fact-checking
Název práce: Vyhodnocení a omezení ztráty informací v souhrnech článků o ověřování klimatických faktů vytvořených pomocí umělé inteligence
Autor(ka) práce: Zetek, Ondřej
Typ práce: Bakalářská práce
Vedoucí práce: Vencovský, Filip
Oponenti práce: Haniková, Kateřina
Jazyk práce: English
Abstrakt:
Tato bakalářská práce se zabývá problémem efektivního zpracování dlouhých článků zaměřených na ověřování faktů, přičemž se konkrétně zaměřuje na články týkající se klimatu, a to při zachování faktické správnosti a transparentnosti pro koncové uživatele. Práce představuje návrh a implementaci interaktivní webové aplikace, která podporuje načítání článků z dané URL adresy nebo ručního zadání textu, automatické vytváření shrnutí a iterativní zdokonalování zaměřené na metriky. Vyvinuté řešení kombinuje techniky pro načítání textu (včetně specifických metod s ohledem na doménu a záložních metod), předzpracování pro odstranění textového šumu a generování shrnutí s konfigurovatelnou délkou výstupu. Uživatel může znovu generovat shrnutí s omezeními délky a poskytovat zpětnou vazbu modelu, což umožňuje kontrolu a vhled do samotného procesu shrnování. Aby bylo možné posoudit kvalitu shrnutí nad rámec překrývání slov, práce integruje multidimenzionální hodnotící rámec zaměřený na pokrytí datových bodů, dimenzionální úplnost, vážené pokrytí, a také proxy fakticity inspirované výzkumem v oblasti hodnocení sumarizace dlouhých dokumentů. Výsledný systém dokazuje, že shrnování řízené uživatelem a hodnocení zohledňující faktickou správnost poskytuje praktický a použitelný postup pro shrnování za účelem ověřování klimatických faktů a nabízí možnost důvěryhodných pracovních postupů ověřování faktů s podporou umělé inteligence.
Klíčová slova: ověřování faktů o klimatu; shrnování rozsáhlých dokumentů; interaktivní shrnování; metriky pro hodnocení chybějících informací; vysvětlitelné ověřování faktů

Informace o studiu

Studijní program / obor: Data Analytics
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 1. 1. 2026
Datum podání práce: 11. 5. 2026
Datum obhajoby: 16. 6. 2026
Identifikátor v systému InSIS: https://insis.vse.cz/zp/96010/podrobnosti

Soubory ke stažení

    Poslední aktualizace: