Software comparison for invoice digitization

Thesis title: Porovnání softwarů na digitalizaci faktur
Author: Zahálka, Jiří
Thesis type: Bakalářská práce
Supervisor: Bruckner, Tomáš
Opponents: Kiš, Juraj
Thesis language: Česky
Tato bakalářská práce se zabývá porovnáním softwarů, které využívají moderní dostupné technologie k digitalizaci faktur a technikami, které jsou k digitalizaci využívané. Na úvod je vysvětlena daná problematika, proč je třeba se daným tématem zabývat, jaké výhody s sebou digitalizace faktur přináší a jsou popsány stanovené cíle práce.V hlavní části jsou popsané techniky, které se při digitalizaci využívají, jako je OCR pro převod tištěného textu do digitální podoby. Sémantická analýza, která zkoumá význam mezi jazykovými spojeními. Regulární výrazy, pro efektivní vyhledávání v textu. Umělá inteligence, která napodobuje činnost projevující vlastnosti inteligentního chování. Strojové učení a neuronové sítě, které jsou schopny na základě vlastních znalostí předpovídat pravděpodobnost úspěšnosti. A nakonec je představeno RPA, které je nezbytné pro zpracování faktury od OCR až po zaplacení faktury, kromě samotného zpracování.V následující kapitole jsou představeny dvě společnosti a jejich softwary, které se digitalizací faktur zabývají. Jednou z nich je Společnost Rossum a software Elis pro snadné zpracování dodavatelských faktur s vytrénovanou neuronovou sítí a druhá společnost Workfusion, která nabízí software SPA, což je vývojářské prostředí obsahující komponentu pro zpracování dodavatelský faktur s předem nevytrénovanou neuronovou sítí, která se učí s každou zpracovanou fakturou.Dále jsou pevně stanovena kritéria pro možné otestování a porovnání tak, aby byly přínosné z pohledů všech zainteresovaných skupin ve společnostech, které tento software budou implementovat. Jedná se zejména o uživatele pracující s aplikací, IT, business a riskové oddělení společnosti. Otestování je provedeno slovním ohodnocením dle stanovených kritérií. Po otestování jsou oba dva softwary porovnány z jednotlivých pohledů společnosti, dle stanovené metodiky, která přiřazuje u daného kritéria porovnávanému softwaru vyšší bodové ohodnocení dle otestování. Po porovnání je konstatováno, že software Elis od společnosti Rossum je dle stanovené metodiky lepším řešením.V závěru této práce je shrnuto, čím se tato práce zabývala, jaké techniky byly popsány, proč byly popsány a čeho bylo dosaženo. Hlavním přínosem této bakalářské práce je otestování a porovnání obou softwarů, což je velmi důležité pro rozhodnutí všech společnosti, které uvažují o zavedení moderního softwaru pro digitalizaci faktur.
Keywords: digitalizace; OCR; sémantika; regulární výraz; strojové učení; rozhodovací strom; neuronová síť; faktura; umělá inteligence; Rossum; Workfusion
Thesis title: Software comparison for invoice digitization
Author: Zahálka, Jiří
Thesis type: Bachelor thesis
Supervisor: Bruckner, Tomáš
Opponents: Kiš, Juraj
Thesis language: Česky
This bachelor thesis focuses on the comparison of two software using modern technologies for invoice digitization and techniques used for it. The introduction explains problematics and the importance of this topic as well as determined goals of this thesis.The main part describes the techniques used for digitization, such as OCR for transferring printed text into digital form. Semantic analysis that examines the importance of language connections. Regular expressions for effective text search. Artificial intelligence that mimics activity that exhibits intelligent behavior. Machine learning and neural networks that are able to predict the likelihood of success based on their own knowledge. Finally, the RPA necessary for processing the invoice from OCR to invoice payment, excluding the processing of the invoice itself.The following chapter introduces two companies and their software that deals with the digitization of invoices. One of them is company called Rossum and Software Elis for easy processing of invoices with pre-trained neural network. The second is Workfusion and software SPA which is a development environment that includes component for invoice processing. SPA is delivered without pre-trained neural network which learns with each processed invoice.Furthermore, criteria for testing and software comparison are firmly described to benefit from the views of different stakeholders in the companies that will most likely implement the software. These include users, IT, business and risk departments.Testing is done as a verbal evaluation according to established criteria. After testing, the two software are compared from individual company views, according to the methodology that assigns a higher score to the software compared to the other software. After comparison, it is noted that Rossum’s Elis software is assessed as a better solution according to the established methodology.At the end of this work, there is a summary of what this thesis has achieved, which techniques have been described and why they have been described. The main benefit of this bachelor thesis is the testing and comparison of two software which is very important for the decision of all companies considering the implementation of modern software for invoice digitization.
Keywords: invoice; OCR; Rossum; Workfusion; semantics; digitization; regular expression; artificial intelligence; machine learning; decision tree; neural network

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 16. 10. 2017
Date of submission: 26. 4. 2018
Date of defense: 19. 6. 2018
Identifier in the InSIS system:

Files for download

    Last update: