Pricelist of the usual pricing of ICT work

Thesis title: Ceník obvyklých cen ICT prací
Author: Hronek, Tomáš
Thesis type: Diplomová práce
Supervisor: Bruckner, Tomáš
Opponents: Vencovský, Filip
Thesis language: Česky
Práce se věnuje návrhu a vývoji částí systému umožňujícího tvorbu ceníku ICT prací, včetně určení míry přesnosti a úplnosti. Práci lze tematicky zařadit do kategorie vy-hledávání dokumentů a extrakce informací.Cílem práce je vyvinout a ověřit způsob identifikace relevantních smluv z registru smluv, navrhnout extrakci cenových údajů a optimalizaci procesu validace cenových údajů. K dosažení cíle byla použita rešerše informačních zdrojů, Design Science Re-search Methodology a rovněž i obecné logické metody.Autorovi se podařilo navrhnout dotazy pro identifikaci relevantních smluv, které na testovacím vzorku 458 smluv dosahují přesnosti 21,4% a úplnosti 71,6%. Tyto dotazy jsou použity v produkční verzi ceníku. Na základě analýzy průběhu první iterace pro-jektu byla autorem navržena optimalizace procesu validace extrahovaných cen, při které se podařilo snížit počet operací o 52 % a současně dobu trvání operací hledání o 80% oproti původnímu průběhu procesu.V práci byl rovněž navržen regulární výraz k extrakci cenových údajů, na jehož základě vznikla finální extrakční funkce node.js. Potvrzením úspěšnosti ceníku, byla žádost objednatele ceníku o návrh nařízení vlády, které by dodalo ceníku váhu při přípravě a vyhodnocení veřejných zakázek na ICT práce. Kapitoly jsou přiřazeny jednotlivým částem metody DSRM, struktura jednotlivých kapitol je z velké části postavena s ohledem na IMRAD.
Keywords: Ceník ICT prací; optimalizace procesu; registr smluv; elasticsearch; nestrukturovaná data
Thesis title: Pricelist of the usual pricing of ICT work
Author: Hronek, Tomáš
Thesis type: Diploma thesis
Supervisor: Bruckner, Tomáš
Opponents: Vencovský, Filip
Thesis language: Česky
The thesis deals with the design and development of the parts of the system allowing the creation of a pricelist of ICT works, including the determination of precision and recall. The work can be thematically classified into the category of Document retrieval and Information extraction.The aim of the thesis is to develop and verify a way to identify relevant contracts from the register of contracts, design the extraction of price data and to optimize the price data validation process.To achieve the goal, information science research, Design Science Research Methodo-logy, as well as general logic methods were used.The author has been able to design queries for the identification of relevant contracts, reaching a 21.4% precision and 71.6% recall on a sample of 458 contracts. These queries are used in the production version of the pricelist.Based on the analysis of the course of the first iteration of the project, the author proposed an optimization of the extracted price validation process, which reduced the number of operations by 52% and the duration of the search opera-tions by 80% compared to the original process.A regular expression for extracting price data was also designed in the thesis, which resulted in the final extraction function in node.js. The price list's success was confirmed by the fact that the orde-ring customer requested a proposal for a government decree, which would add weight to the price list for the preparation and evaluation of public works contracts for ICT work.The chapters are assigned to individual parts of the DSRM method, the structure of individual chapters is largely built with respect to IMRAD.
Keywords: ICT work pricelist; unstructured data; register of contracts; elasticsearch; process optimization

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Date of assignment: 1. 3. 2017
Date of submission: 23. 4. 2018
Date of defense: 6. 6. 2018
