Výběr OCR řešení pro zpracování faktur
Název práce: | Výběr OCR řešení pro zpracování faktur |
---|---|
Autor(ka) práce: | Dědina, Lukáš |
Typ práce: | Diplomová práce |
Vedoucí práce: | Buchalcevová, Alena |
Oponenti práce: | Doležel, Michal |
Jazyk práce: | Česky |
Abstrakt: | I Když má optické rozpoznávání znaků svůj původ již v první polovině dvacátého století, získává v současné době kvůli rozvoji techniky na významu v rámci počítačového vidění a rozpoznávání objektů. V této práci bude krátce popsána historie OCR a techniky využívané pro zpracování obrazu. Důraz je kvůli zaměření práce kladen na současné metody rozpoznávání textu a na výhody, které s sebou přináší digitalizace faktur. Jelikož v této oblasti hrají velkou roli neuronové sítě, především v procesu inteligentního učení, budou představeny jednotlivé prvky těchto sítí. Dále bude představeno, jak neuronové sítě fungují a některé jejich architektury. V následující části jsou představeny dvě společnosti a řešení, které využívají pro skenování a validaci faktur. Jsou stanovena kritéria pro testování a provedením multikriteriální analýzy je vyhodnoceno kvalitnější řešení a to se bude v další části zpracovávat. Následně bude na základě získaných informací navržena optimalizace řešení, které bylo úspěšnější v multikriteriální analýze. Bude realizována optimalizace pomocí kontrolních součtů, která zajistí automatickou validaci faktur. Automatická validace je otestována pomocí experimentu se sto vzorovými fakturami. Celý proces zpracování je následně představen na konkrétním příkladu jedné faktury. Další část se zaměřuje na možné rozšíření napojením na bankovní API. Jedná se o případovou studii, která má za cíl představit další možnosti automatizace přes přímé napojení na bankovní API.V závěru práce je shrnuto, čím se tato práce zabývala a jakých výsledků dosáhla. Hlavním přínosem této práce je realizovaná optimalizace zpracování faktur, která může sloužit jako koncept pro další společnosti. |
Klíčová slova: | OCR; optické rozpoznávání znaků; metody OCR; historie OCR; neuronové sítě; soft computing; konvoluční neuronové sítě; optimalizace; automatická validace; API |
Název práce: | Selection of OCR Solution for Invoice Processing |
---|---|
Autor(ka) práce: | Dědina, Lukáš |
Typ práce: | Diploma thesis |
Vedoucí práce: | Buchalcevová, Alena |
Oponenti práce: | Doležel, Michal |
Jazyk práce: | Česky |
Abstrakt: | Even when optical character recognition has been researched since first half of twentieth century, it has received a major importance in computer vision and object detection due to the development of technology at this time. This thesis present the history of OCR and techniques used for image processing will be briefly described. Thesis is focused on text recognition methods and the benefits of digitizing invoices. As neural networks play a major role in this area, especially in the process of intelligent learning, the elements of these networks will be presented. Next, it will be introduced how neural networks work and some of their architectures. The following section introduces two companies and solutions that they use to scan and validate invoices. Criteria are set for testing and a higher quality solution is evaluated by a multi-criteria analysis and it will be processed in the next part.More successful solution will be optimized. Checksum optimization will be implemented to ensure automatic invoice validation. Automatic validation is tested using an experiment with one hundred sample invoices. The entire processing process is then presented on a specific example of one invoice.The next section is focused on the possible expansion by linking to the bank API. This is a case study that aims to introduce additional possible automation. The conclusion summarizes goals of this thesis and what results it has achieved. The main benefit of this work is the implemented optimization of invoice processing, which can serve as a concept for other companies. |
Klíčová slova: | convolutional neural networks; optimalization; automatical validation; API; OCR methods; OCR; optical character recognition; OCR history; neural networks; soft computing |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Podniková informatika |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 7. 6. 2018 |
---|---|
Datum podání práce: | 24. 4. 2019 |
Datum obhajoby: | 27. 5. 2019 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/66141/podrobnosti |