Automatization of the digitization workflow of the National Library of Technology
Thesis title: | Automatizace digitalizačního workflow NTK |
---|---|
Author: | Řihák, Jakub |
Thesis type: | Diplomová práce |
Supervisor: | Kosek, Jiří |
Opponents: | Římanová, Radka |
Thesis language: | Česky |
Abstract: | Tato práce se zaměřuje na automatizaci procesů digitalizačního workflow Národní technické knihovny. Práce zkoumá možnosti automatizace těchto procesů pomocí skriptů vytvořených v programovacím jazyce Perl a skriptů vytvořených pomocí sestavovacího nástroj Apache Ant. V práci jsou srovnávány výhody a nevýhody obou řešení a vhodnost jejich použití pro účely automatizace procesů digitalizace dokumentů. Na základě vzájemného srovnání obou řešení, a to jak z hlediska teoretického, tak i praktického, je jako nejvhodnější určena automatizace procesů pomocí skriptů v programovacím jazyce Perl. V práci je také zodpovězena otázka, zda je možné pro účely automatizace procesů digitalizačního workflow využít sestavovací nástroj Ant. Tento nástroj je možné použít, ovšem bylo zjištěno, že pokud se některá z činností v některém z procesů odchýlí z rámce daného úlohami nástroje Ant, znamená to neúměrné zvýšení složitosti celého řešení. Složitost řešení automatizace procesů pomocí Antu se odvíjí od nutnosti využívat již předem vytvořené úlohy, soubory funkcí, které je následně možné kombinovat a vytvořit tak skript automatizující některý z procesů digitalizačního workflow. Ant je rozšiřitelný, je možné vytvářet vlastní úlohy, ovšem to je podmíněno znalostí programovacího jazyka Java. Programovací jazyk Perl naopak umožňuje snazší přizpůsobení skriptů potřebám daných procesů. Rovněž modularita programovacího jazyka Perl zjednodušuje vytváření těchto skriptů, jejich následné úpravy, opravy a další rozvoj. |
Keywords: | Národní technická knihovna; Apache Ant; Perl; automatizace; digitální knihovna; workflow; digitalizace |
Thesis title: | Automatization of the digitization workflow of the National Library of Technology |
---|---|
Author: | Řihák, Jakub |
Thesis type: | Diploma thesis |
Supervisor: | Kosek, Jiří |
Opponents: | Římanová, Radka |
Thesis language: | Česky |
Abstract: | This diploma thesis is focused on the automatization of digitization workflow in the National Library of Technology, Prague, Czech Republic. This thesis examines possibilities of digitization processes automatization by means of scripts written in Perl programming language and Apache Ant build tool. The advantages and disadvantages of both solutions are analyzed as well as their suitability for automatization of digitization workflow. Based on the comparison of both solutions, the scripts in Perl programming language are selected as the most suitable solution for automatization of digitization workflow. The question whether Ant build tool could be used for the purpose of automatization of digitization workflow is also answered in this thesis. The Ant build tool could be used for the above-mentioned purpose. However, once the activities in the given process divert from the general scope of tasks provided by the Ant build tool, the complexity of the whole solution increases rapidly. This complexity is given by the necessity to use predefined tasks -- sets of functions which have to be combined to create a functional automatization script. Even though Ant is an extendable tool, it is necessary to understand the Java programming language in order to create a new Ant task successfully. On the other hand, the Perl programming language allows easier customization of the script for the purposes of automatization of digitization workflow. Also, the modularity of the Perl programming language makes it easier to create those scripts and modify, correct or develop them even further. |
Keywords: | Apache Ant build tool; National Library of Technology; Perl programming language; workflow; digital library; automatization; digitization |
Information about study
Study programme: | Aplikovaná informatika/Znalostní technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 4. 9. 2013 |
---|---|
Date of submission: | 1. 5. 2014 |
Date of defense: | 10. 6. 2014 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/43750/podrobnosti |