Aplikace pokročilé cloudové datové analytiky v prostředí e-commerce společnosti

Název práce: Aplikace pokročilé cloudové datové analytiky v prostředí e-commerce společnosti
Autor(ka) práce: Svědiroh, Jan
Typ práce: Diplomová práce
Vedoucí práce: Novotný, Ota
Oponenti práce: Vencovský, Filip
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá aplikací pokročilé cloudové datové analytiky v prostředí společnosti působící v e-commerce sektoru. Hlavním cílem práce je vyvinout a aplikovat model strojového učení, s jehož pomocí bude klient schopen klasifikovat, do kterých webových navigačních kategorií produkty spadají na základě daných kritérií. V úvodu práce je blíže specifikováno business zadání projektu společně s jeho hlavním přínosem pro angažované společnosti. V první části se autor zabývá samotným prostředím e-commerce a významu dat v tomto vysoce konkurenčním a dynamickém odvětví. Jsou popsány různé zdroje a typy dat společně s možnostmi jejich získání, čímž jsou položeny základy pro komplexní pochopení kontextu práce. Poté autor představuje vhodné vybrané datové sady a jejich sloupce, které jsou následně zpracovány a transformovány tak, aby splňovaly požadavky potřebné pro jejich využití v rámci úlohy strojového učení. Značný důraz je kladen na inženýrství funkcí při hledání uspokojivého zpracování dat pro vybrané modely, kde je vyzkoušeno několik technik. Po fázi přípravy dat jsou představeny a implementovány vybrané modely strojového učení s cílem identifikovat nejvýkonnější kombinaci na základě konkrétních klasifikačních metrik. Výstupem práce je nasazené nejvhodnější řešení na cloudové platformě AWS.
Klíčová slova: strojové učení; e-commerce; pokročilá datová analytika; zpracování přirozeného jazyka
Název práce: Application of advanced cloud data analytics in an e-commerce company's environment
Autor(ka) práce: Svědiroh, Jan
Typ práce: Diploma thesis
Vedoucí práce: Novotný, Ota
Oponenti práce: Vencovský, Filip
Jazyk práce: Česky
Abstrakt:
This thesis deals with the application of advanced cloud data analytics in the environment of a company operating in the e-commerce sector. The main objective of the thesis is to develop and apply a machine learning model, with the help of which the client will be able to classify which web navigation categories products fall into based on given criteria. In the introduction of the thesis, the business assignment of the project is specified along with its primary benefits for the companies involved. In the first part, the author discusses the e-commerce environment and data’s importance in this highly competitive and dynamic industry. Various sources and types of data are described, along with the possibilities of obtaining them, laying the foundations for a comprehensive understanding of the context of the thesis. The author then presents suitably selected datasets and their columns, which are then processed and transformed to meet the requirements for their use in a machine-learning task. Considerable emphasis is placed on feature engineering in the search for satisfactory data processing for the selected models, where several techniques are tried. After the data preparation phase, the selected machine learning models are presented and implemented to identify the best-performing combination based on specific classification metrics. The thesis output is deploying the most suitable solution on the AWS cloud platform.
Klíčová slova: machine learning; advanced analytics; natural language processing; e-commerce

Informace o studiu

Studijní program / obor: Data a analytika pro business
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 31. 10. 2022
Datum podání práce: 30. 6. 2023
Datum obhajoby: 11. 10. 2023
Identifikátor v systému InSIS: https://insis.vse.cz/zp/84376/podrobnosti

Soubory ke stažení

Hlavní práce
Neveřejný soubor
Stáhnout
    Poslední aktualizace: