Automatization of the digitization workflow of the National Library of Technology

Thesis title: Automatizace digitalizačního workflow NTK
Author: Řihák, Jakub
Thesis type: Diplomová práce
Supervisor: Kosek, Jiří
Opponents: Římanová, Radka
Thesis language: Česky
Abstract:
Tato práce se zaměřuje na automatizaci procesů digitalizačního workflow Národní technické knihovny. Práce zkoumá možnosti automatizace těchto procesů pomocí skriptů vytvořených v programovacím jazyce Perl a skriptů vytvořených pomocí sestavovacího nástroj Apache Ant. V práci jsou srovnávány výhody a nevýhody obou řešení a vhodnost jejich použití pro účely automatizace procesů digitalizace dokumentů. Na základě vzájemného srovnání obou řešení, a to jak z hlediska teoretického, tak i praktického, je jako nejvhodnější určena automatizace procesů pomocí skriptů v programovacím jazyce Perl. V práci je také zodpovězena otázka, zda je možné pro účely automatizace procesů digitalizačního workflow využít sestavovací nástroj Ant. Tento nástroj je možné použít, ovšem bylo zjištěno, že pokud se některá z činností v některém z procesů odchýlí z rámce daného úlohami nástroje Ant, znamená to neúměrné zvýšení složitosti celého řešení. Složitost řešení automatizace procesů pomocí Antu se odvíjí od nutnosti využívat již předem vytvořené úlohy, soubory funkcí, které je následně možné kombinovat a vytvořit tak skript automatizující některý z procesů digitalizačního workflow. Ant je rozšiřitelný, je možné vytvářet vlastní úlohy, ovšem to je podmíněno znalostí programovacího jazyka Java. Programovací jazyk Perl naopak umožňuje snazší přizpůsobení skriptů potřebám daných procesů. Rovněž modularita programovacího jazyka Perl zjednodušuje vytváření těchto skriptů, jejich následné úpravy, opravy a další rozvoj.
Keywords: Národní technická knihovna; Apache Ant; Perl; automatizace; digitální knihovna; workflow; digitalizace
Thesis title: Automatization of the digitization workflow of the National Library of Technology
Author: Řihák, Jakub
Thesis type: Diploma thesis
Supervisor: Kosek, Jiří
Opponents: Římanová, Radka
Thesis language: Česky
Abstract:
This diploma thesis is focused on the automatization of digitization workflow in the National Library of Technology, Prague, Czech Republic. This thesis examines possibilities of digitization processes automatization by means of scripts written in Perl programming language and Apache Ant build tool. The advantages and disadvantages of both solutions are analyzed as well as their suitability for automatization of digitization workflow. Based on the comparison of both solutions, the scripts in Perl programming language are selected as the most suitable solution for automatization of digitization workflow. The question whether Ant build tool could be used for the purpose of automatization of digitization workflow is also answered in this thesis. The Ant build tool could be used for the above-mentioned purpose. However, once the activities in the given process divert from the general scope of tasks provided by the Ant build tool, the complexity of the whole solution increases rapidly. This complexity is given by the necessity to use predefined tasks -- sets of functions which have to be combined to create a functional automatization script. Even though Ant is an extendable tool, it is necessary to understand the Java programming language in order to create a new Ant task successfully. On the other hand, the Perl programming language allows easier customization of the script for the purposes of automatization of digitization workflow. Also, the modularity of the Perl programming language makes it easier to create those scripts and modify, correct or develop them even further.
Keywords: Apache Ant build tool; National Library of Technology; Perl programming language; workflow; digital library; automatization; digitization

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 4. 9. 2013
Date of submission: 1. 5. 2014
Date of defense: 10. 6. 2014
Identifier in the InSIS system: https://insis.vse.cz/zp/43750/podrobnosti

Files for download

    Last update: