Data capture from structured documents

Thesis title: Digitalizace strukturovaných dokumentů
Author: Žižka, Ondřej
Thesis type: Bakalářská práce
Supervisor: Kunstová, Renáta
Opponents: Marešová, Zdena
Thesis language: Česky
Abstract:
Tato bakalářská práce se zaměřuje především na digitalizaci strukturovaných dokumentů. Popisuje obecně proces digitalizace a všechny jeho fáze. Řeší otázku, proč je dobré digitalizovat, jakého způsobu k tomu využít a jakých prostředků je k tomu potřeba. Dále jsou zde vymezeny druhy digitalizovaných dokumentů a míra jejich strukturalizace. Nejvíce pozornosti je pak věnováno strukturovaným dokumentům a jejich vlastnostem, funkcím, častým nedostatkům, jejich optimalizaci a tvorbě. Jsou zde uvedeny jednotlivé části takového dokumentu, jejich možnosti a doporučené nastavení. V druhé části práce je pak konkrétní příklad zakázky na vytvoření snadno zpracovatelného formuláře a následného vytěžování dat z něj pro České Energetické Centrum Jih s.r.o. V této části je na konkrétních prvcích vytvořeného dokumentu ukázána jejich vhodná konfigurace.
Keywords: digitalizace; vytěžování dat; strukturovaný dokument
Thesis title: Data capture from structured documents
Author: Žižka, Ondřej
Thesis type: Bachelor thesis
Supervisor: Kunstová, Renáta
Opponents: Marešová, Zdena
Thesis language: Česky
Abstract:
The Bachelor thesis is focused primarily on digitalization of structured documents. It describes the process of digitalization and all of its phases. It answers the question why imaging and scanning, what is the best way of doing it and what resources are necessary. Types of scanned documents and the extent of their structuring is also being defined. Most attention is paid to structured documents and their attributes, functions, frequent deficiencies, their optimization and development. Individual parts of such a document as well as their options and recommended settings are described. In the second part of this thesis there is a specific example of a contract with the aim to develop an easily processable document and then perform a data capture. This contract was specified by the company České Energetické Centrum Jih s.r.o.. In this section an appropriate configuration is being showed on particular elements.
Keywords: scanning; data capture; structured document

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 22. 3. 2011
Date of submission: 1. 12. 2011
Date of defense: 19. 1. 2012
Identifier in the InSIS system: https://insis.vse.cz/zp/31563/podrobnosti

Files for download

    Last update: