Vyhodnocení a omezení ztráty informací v souhrnech článků o ověřování klimatických faktů vytvořených pomocí umělé inteligence
| Název práce: | Evaluation and Mitigation of Information Loss in AI Summaries of Climate Fact-Checking Articles |
|---|---|
| Autor(ka) práce: | Zetek, Ondřej |
| Typ práce: | Bachelor thesis |
| Vedoucí práce: | Vencovský, Filip |
| Oponenti práce: | Haniková, Kateřina |
| Jazyk práce: | English |
| Abstrakt: | This bachelor’s thesis addresses the problem of efficiently processing long fact-check articles, the use case specifically focuses on climate related articles, while preserving factual correctness and transparency for end users. The work presents the design and implementation of an interactive web application that supports article fetching from a given URL address or manual text input, automatic summarization, and metric-oriented iterative refinement. The developed solution combines techniques for text fetching (including domain-aware parsing and fallback methods), preprocessing for textual noise removal, and summary generation with configurable output length. The user can regenerate summaries with length constraints and give feedback to the model, enabling control and insight into the summarization process itself. To assess summary quality beyond word overlap, the thesis integrates a multidimensional evaluation framework focused on data point coverage, dimensional completeness, and weighted coverage, as well as factuality proxies inspired by long-document evaluation research. The resulting system demonstrates that combining robust retrieval, user-guided summarization, and factuality-aware evaluation provides a practical and usable pipeline for climate fact-check summarization, and offers an option to trustworthy AI-assisted fact-checking workflows. |
| Klíčová slova: | long-document summarization; interactive summarization; dimensional evaluation metrics; explainable fact-checking; climate fact-checking |
| Název práce: | Vyhodnocení a omezení ztráty informací v souhrnech článků o ověřování klimatických faktů vytvořených pomocí umělé inteligence |
|---|---|
| Autor(ka) práce: | Zetek, Ondřej |
| Typ práce: | Bakalářská práce |
| Vedoucí práce: | Vencovský, Filip |
| Oponenti práce: | Haniková, Kateřina |
| Jazyk práce: | English |
| Abstrakt: | Tato bakalářská práce se zabývá problémem efektivního zpracování dlouhých článků zaměřených na ověřování faktů, přičemž se konkrétně zaměřuje na články týkající se klimatu, a to při zachování faktické správnosti a transparentnosti pro koncové uživatele. Práce představuje návrh a implementaci interaktivní webové aplikace, která podporuje načítání článků z dané URL adresy nebo ručního zadání textu, automatické vytváření shrnutí a iterativní zdokonalování zaměřené na metriky. Vyvinuté řešení kombinuje techniky pro načítání textu (včetně specifických metod s ohledem na doménu a záložních metod), předzpracování pro odstranění textového šumu a generování shrnutí s konfigurovatelnou délkou výstupu. Uživatel může znovu generovat shrnutí s omezeními délky a poskytovat zpětnou vazbu modelu, což umožňuje kontrolu a vhled do samotného procesu shrnování. Aby bylo možné posoudit kvalitu shrnutí nad rámec překrývání slov, práce integruje multidimenzionální hodnotící rámec zaměřený na pokrytí datových bodů, dimenzionální úplnost, vážené pokrytí, a také proxy fakticity inspirované výzkumem v oblasti hodnocení sumarizace dlouhých dokumentů. Výsledný systém dokazuje, že shrnování řízené uživatelem a hodnocení zohledňující faktickou správnost poskytuje praktický a použitelný postup pro shrnování za účelem ověřování klimatických faktů a nabízí možnost důvěryhodných pracovních postupů ověřování faktů s podporou umělé inteligence. |
| Klíčová slova: | ověřování faktů o klimatu; shrnování rozsáhlých dokumentů; interaktivní shrnování; metriky pro hodnocení chybějících informací; vysvětlitelné ověřování faktů |
Informace o studiu
| Studijní program / obor: | Data Analytics |
|---|---|
| Typ studijního programu: | Bakalářský studijní program |
| Přidělovaná hodnost: | Bc. |
| Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
| Fakulta: | Fakulta informatiky a statistiky |
| Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
| Datum zadání práce: | 1. 1. 2026 |
|---|---|
| Datum podání práce: | 11. 5. 2026 |
| Datum obhajoby: | 16. 6. 2026 |
| Identifikátor v systému InSIS: | https://insis.vse.cz/zp/96010/podrobnosti |