Návrh rozhodovacího modelu pro posouzení vhodnosti automatizace zpracovávání textových dokumentů

Název práce: Návrh rozhodovacího modelu pro posouzení vhodnosti automatizace zpracovávání textových dokumentů
Autor(ka) práce: Mandík, Jan
Typ práce: Diplomová práce
Vedoucí práce: Strossa, Petr
Oponenti práce: Bruckner, Tomáš
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá digitalizovaným zpracováním dokumentů, které nejsou v elektronické podobě a které postrádají pevně danou, předvídatelnou strukturu. Na úvod je vysvětlena daná problematika, smysl tohoto tématu a důvody digitalizace dokumentů. V hlavní části jsou popsané základní pojmy navázané na téma, technologie a principy využívané při digitalizaci dokumentů. Následně jsou popsány a analyzovány klíčové vlastnosti dokumentů, které rozhodují o tom, zda jsou dokumenty vhodné pro digitalizaci. Na analýzu a popis těchto pojmů a vlastností navazuje návrh rozhodovacího modelu sloužící pro posouzení vhodnosti automatizace zpracování dokumentů. Tato vhodnost je posuzována jak z pohledu technologického, tak z pohledu ekonomického. Zdrojem tohoto rozhodovacího modelu je dotazníkové šetření a analýza v praxi provedených implementací automatizovaného zpracování dokumentů. Rozhodovací model je posléze ověřen na příkladech konkrétních typů dokumentů, u nichž existuje poptávka po jejich automatickém zpracování. V závěru této práce je shrnuto, čím se práce zabývala, co a proč bylo popsáno a čeho bylo dosaženo. Hlavním přínosem této práce je vytvoření rozhodovacího modelu umožňující posoudit vhodnost automatizace zpracování konkrétních skupin dokumentů. Takový rámec umožní učinit snadnější rozhodnutí firmám, které v rámci svojí činnosti automatizaci zpracování dokumentů zvažují.
Klíčová slova: Machine Learning; OCR; RPA; IPA; NLP; Automatizované zpracování dokumentů
Název práce: Decision model for evaluation of automated document processing feasibility
Autor(ka) práce: Mandík, Jan
Typ práce: Diploma thesis
Vedoucí práce: Strossa, Petr
Oponenti práce: Bruckner, Tomáš
Jazyk práce: Česky
Abstrakt:
This diploma thesis deals with the topic of automated processing of documents that are not in electronic form and that lack a fixed, predictable structure. The introduction explains the issue, the meaning of this topic and the reasons for digitizing documents. The main part of this thesis describes the basic concepts related to the topic, technology and principles used in document digitization. Subsequently, the key properties of documents, which decide whether the documents are suitable for digitization, are described and analysed. The analysis and description of these concepts and properties is followed by the design of a decision model used to assess the suitability of document processing automation. This suitability is assessed from both a technological and an economic point of view. The source of this decision-making model is a questionnaire survey and analysis of implementation of automated document processing use cases. The decision model is then verified on examples of specific types of documents for which there is a demand for their automatic processing. At the end of this work is summarized what the work dealt with, what and why was described and what was achieved. The main benefit of this work is creation of a decision model to assess the suitability of automating the processing of specific groups of documents. Such a framework will make it easier to make decisions for those companies that are considering automating document processing.
Klíčová slova: Automated document processing; IPA; Machine Learning; NLP; RPA; OCR

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 21. 10. 2019
Datum podání práce: 1. 12. 2021
Datum obhajoby: 21. 1. 2022
Identifikátor v systému InSIS: https://insis.vse.cz/zp/71375/podrobnosti

Soubory ke stažení

    Poslední aktualizace: