Decision model for evaluation of automated document processing feasibility
Thesis title: | Návrh rozhodovacího modelu pro posouzení vhodnosti automatizace zpracovávání textových dokumentů |
---|---|
Author: | Mandík, Jan |
Thesis type: | Diplomová práce |
Supervisor: | Strossa, Petr |
Opponents: | Bruckner, Tomáš |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá digitalizovaným zpracováním dokumentů, které nejsou v elektronické podobě a které postrádají pevně danou, předvídatelnou strukturu. Na úvod je vysvětlena daná problematika, smysl tohoto tématu a důvody digitalizace dokumentů. V hlavní části jsou popsané základní pojmy navázané na téma, technologie a principy využívané při digitalizaci dokumentů. Následně jsou popsány a analyzovány klíčové vlastnosti dokumentů, které rozhodují o tom, zda jsou dokumenty vhodné pro digitalizaci. Na analýzu a popis těchto pojmů a vlastností navazuje návrh rozhodovacího modelu sloužící pro posouzení vhodnosti automatizace zpracování dokumentů. Tato vhodnost je posuzována jak z pohledu technologického, tak z pohledu ekonomického. Zdrojem tohoto rozhodovacího modelu je dotazníkové šetření a analýza v praxi provedených implementací automatizovaného zpracování dokumentů. Rozhodovací model je posléze ověřen na příkladech konkrétních typů dokumentů, u nichž existuje poptávka po jejich automatickém zpracování. V závěru této práce je shrnuto, čím se práce zabývala, co a proč bylo popsáno a čeho bylo dosaženo. Hlavním přínosem této práce je vytvoření rozhodovacího modelu umožňující posoudit vhodnost automatizace zpracování konkrétních skupin dokumentů. Takový rámec umožní učinit snadnější rozhodnutí firmám, které v rámci svojí činnosti automatizaci zpracování dokumentů zvažují. |
Keywords: | Machine Learning; OCR; RPA; IPA; NLP; Automatizované zpracování dokumentů |
Thesis title: | Decision model for evaluation of automated document processing feasibility |
---|---|
Author: | Mandík, Jan |
Thesis type: | Diploma thesis |
Supervisor: | Strossa, Petr |
Opponents: | Bruckner, Tomáš |
Thesis language: | Česky |
Abstract: | This diploma thesis deals with the topic of automated processing of documents that are not in electronic form and that lack a fixed, predictable structure. The introduction explains the issue, the meaning of this topic and the reasons for digitizing documents. The main part of this thesis describes the basic concepts related to the topic, technology and principles used in document digitization. Subsequently, the key properties of documents, which decide whether the documents are suitable for digitization, are described and analysed. The analysis and description of these concepts and properties is followed by the design of a decision model used to assess the suitability of document processing automation. This suitability is assessed from both a technological and an economic point of view. The source of this decision-making model is a questionnaire survey and analysis of implementation of automated document processing use cases. The decision model is then verified on examples of specific types of documents for which there is a demand for their automatic processing. At the end of this work is summarized what the work dealt with, what and why was described and what was achieved. The main benefit of this work is creation of a decision model to assess the suitability of automating the processing of specific groups of documents. Such a framework will make it easier to make decisions for those companies that are considering automating document processing. |
Keywords: | Automated document processing; IPA; Machine Learning; NLP; RPA; OCR |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 21. 10. 2019 |
---|---|
Date of submission: | 1. 12. 2021 |
Date of defense: | 21. 1. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/71375/podrobnosti |