Application of advanced cloud data analytics in an e-commerce company's environment

Thesis title: Aplikace pokročilé cloudové datové analytiky v prostředí e-commerce společnosti
Author: Svědiroh, Jan
Thesis type: Diplomová práce
Supervisor: Novotný, Ota
Opponents: Vencovský, Filip
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá aplikací pokročilé cloudové datové analytiky v prostředí společnosti působící v e-commerce sektoru. Hlavním cílem práce je vyvinout a aplikovat model strojového učení, s jehož pomocí bude klient schopen klasifikovat, do kterých webových navigačních kategorií produkty spadají na základě daných kritérií. V úvodu práce je blíže specifikováno business zadání projektu společně s jeho hlavním přínosem pro angažované společnosti. V první části se autor zabývá samotným prostředím e-commerce a významu dat v tomto vysoce konkurenčním a dynamickém odvětví. Jsou popsány různé zdroje a typy dat společně s možnostmi jejich získání, čímž jsou položeny základy pro komplexní pochopení kontextu práce. Poté autor představuje vhodné vybrané datové sady a jejich sloupce, které jsou následně zpracovány a transformovány tak, aby splňovaly požadavky potřebné pro jejich využití v rámci úlohy strojového učení. Značný důraz je kladen na inženýrství funkcí při hledání uspokojivého zpracování dat pro vybrané modely, kde je vyzkoušeno několik technik. Po fázi přípravy dat jsou představeny a implementovány vybrané modely strojového učení s cílem identifikovat nejvýkonnější kombinaci na základě konkrétních klasifikačních metrik. Výstupem práce je nasazené nejvhodnější řešení na cloudové platformě AWS.
Keywords: strojové učení; e-commerce; pokročilá datová analytika; zpracování přirozeného jazyka
Thesis title: Application of advanced cloud data analytics in an e-commerce company's environment
Author: Svědiroh, Jan
Thesis type: Diploma thesis
Supervisor: Novotný, Ota
Opponents: Vencovský, Filip
Thesis language: Česky
Abstract:
This thesis deals with the application of advanced cloud data analytics in the environment of a company operating in the e-commerce sector. The main objective of the thesis is to develop and apply a machine learning model, with the help of which the client will be able to classify which web navigation categories products fall into based on given criteria. In the introduction of the thesis, the business assignment of the project is specified along with its primary benefits for the companies involved. In the first part, the author discusses the e-commerce environment and data’s importance in this highly competitive and dynamic industry. Various sources and types of data are described, along with the possibilities of obtaining them, laying the foundations for a comprehensive understanding of the context of the thesis. The author then presents suitably selected datasets and their columns, which are then processed and transformed to meet the requirements for their use in a machine-learning task. Considerable emphasis is placed on feature engineering in the search for satisfactory data processing for the selected models, where several techniques are tried. After the data preparation phase, the selected machine learning models are presented and implemented to identify the best-performing combination based on specific classification metrics. The thesis output is deploying the most suitable solution on the AWS cloud platform.
Keywords: machine learning; advanced analytics; natural language processing; e-commerce

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 31. 10. 2022
Date of submission: 30. 6. 2023
Date of defense: 11. 10. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/84376/podrobnosti

Files for download

Main text
Private file
Download
    Last update: