Integrated search on a large number of websites

Thesis title: Integrované vyhledávání na větším množství webů
Author: Krejčí, Filip
Thesis type: Diplomová práce
Supervisor: Vojíř, Stanislav
Opponents: Šubrta, Václav
Thesis language: Česky
Abstract:
Diplomová práce se zabývá aktuálními možnostmi integrace vyhledávání do sítí webových stránek. Součástí práce je analýza aktuálně populárních služeb pro integraci vyhledávání do webových aplikací (Elasticsearch, Apache Solr, Splunk). Na základě analýzy systémů byl zvolen pro konkrétní řešení systém Elasticsearch, který je v práci detailně popsán. V rámci popisu systému Elasticsearch jsou také uvedeny principy distribuovaných systémů a dokumentových databází, a to včetně zmínění možných výhod a nevýhod. Praktická část práce se zabývá tvorbou rozšíření, které umožní uživatelské vyhledávání napříč sítí webových stránek VŠE, jež jsou implementovány v redakčním systému WordPress. Dále se práce věnuje kompletnímu návrhu, podle kterého je implementováno konkrétní řešení. V rámci implementace jsou diskutovány nejdůležitější části kódu, které ukazují, jakým způsobem lze postupovat při implementaci vyhledávání do sítě webů postavených na systému WordPress.
Keywords: Elasticsearch; Solr; Splunk; WordPress; PHP; JavaScript; plugin; integrace vyhledávání; NoSQL; webová aplikace; vyhledávání
Thesis title: Integrated search on a large number of websites
Author: Krejčí, Filip
Thesis type: Diploma thesis
Supervisor: Vojíř, Stanislav
Opponents: Šubrta, Václav
Thesis language: Česky
Abstract:
The thesis deals with the current possibilities of integration of search functionality into the network of multiple websites. Part of this work is analysis of currently popular services for web search integration (Elasticsearch, Apache Solr and Splunk). Based on the analysis of the systems, the Elasticsearch system was chosen for a particular solution, which is described in detail. The thesis also describes the principles of distributed systems and document databases, mentioning the possible advantages and disadvantages. The practical part of the thesis deals with the creation of extensions that enable search across the network of VŠE websites, which are implemented in the content management system WordPress. Furthermore, the thesis deals with design, according to which a specific solution is implemented. The implementation discusses the most important parts of the code that show how to implement search into a wide network of WordPress sites.
Keywords: WordPress; Elasticsearch; Solr; Splunk; search; NoSQL; wep application; PHP; JavaScript; plugin; search integration

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 8. 10. 2019
Date of submission: 4. 5. 2020
Date of defense: 5. 6. 2020
Identifier in the InSIS system: https://insis.vse.cz/zp/71234/podrobnosti

Files for download

    Last update: