Decision model for evaluation of automated document processing feasibility

Thesis title: Návrh rozhodovacího modelu pro posouzení vhodnosti automatizace zpracovávání textových dokumentů
Author: Mandík, Jan
Thesis type: Diplomová práce
Supervisor: Strossa, Petr
Opponents: Bruckner, Tomáš
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá digitalizovaným zpracováním dokumentů, které nejsou v elektronické podobě a které postrádají pevně danou, předvídatelnou strukturu. Na úvod je vysvětlena daná problematika, smysl tohoto tématu a důvody digitalizace dokumentů. V hlavní části jsou popsané základní pojmy navázané na téma, technologie a principy využívané při digitalizaci dokumentů. Následně jsou popsány a analyzovány klíčové vlastnosti dokumentů, které rozhodují o tom, zda jsou dokumenty vhodné pro digitalizaci. Na analýzu a popis těchto pojmů a vlastností navazuje návrh rozhodovacího modelu sloužící pro posouzení vhodnosti automatizace zpracování dokumentů. Tato vhodnost je posuzována jak z pohledu technologického, tak z pohledu ekonomického. Zdrojem tohoto rozhodovacího modelu je dotazníkové šetření a analýza v praxi provedených implementací automatizovaného zpracování dokumentů. Rozhodovací model je posléze ověřen na příkladech konkrétních typů dokumentů, u nichž existuje poptávka po jejich automatickém zpracování. V závěru této práce je shrnuto, čím se práce zabývala, co a proč bylo popsáno a čeho bylo dosaženo. Hlavním přínosem této práce je vytvoření rozhodovacího modelu umožňující posoudit vhodnost automatizace zpracování konkrétních skupin dokumentů. Takový rámec umožní učinit snadnější rozhodnutí firmám, které v rámci svojí činnosti automatizaci zpracování dokumentů zvažují.
Keywords: Machine Learning; OCR; RPA; IPA; NLP; Automatizované zpracování dokumentů
Thesis title: Decision model for evaluation of automated document processing feasibility
Author: Mandík, Jan
Thesis type: Diploma thesis
Supervisor: Strossa, Petr
Opponents: Bruckner, Tomáš
Thesis language: Česky
Abstract:
This diploma thesis deals with the topic of automated processing of documents that are not in electronic form and that lack a fixed, predictable structure. The introduction explains the issue, the meaning of this topic and the reasons for digitizing documents. The main part of this thesis describes the basic concepts related to the topic, technology and principles used in document digitization. Subsequently, the key properties of documents, which decide whether the documents are suitable for digitization, are described and analysed. The analysis and description of these concepts and properties is followed by the design of a decision model used to assess the suitability of document processing automation. This suitability is assessed from both a technological and an economic point of view. The source of this decision-making model is a questionnaire survey and analysis of implementation of automated document processing use cases. The decision model is then verified on examples of specific types of documents for which there is a demand for their automatic processing. At the end of this work is summarized what the work dealt with, what and why was described and what was achieved. The main benefit of this work is creation of a decision model to assess the suitability of automating the processing of specific groups of documents. Such a framework will make it easier to make decisions for those companies that are considering automating document processing.
Keywords: Automated document processing; IPA; Machine Learning; NLP; RPA; OCR

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 21. 10. 2019
Date of submission: 1. 12. 2021
Date of defense: 21. 1. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/71375/podrobnosti

Files for download

    Last update: