Recommender System Using LLMs in E-commerce

Thesis title: Recommender systém s využitím LLM v e-commerce
Author: Husičková, Kateřina
Thesis type: Diplomová práce
Supervisor: Zimmermann, Pavel
Opponents: Vencovský, Filip
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá návrhem, implementací a vyhodnocením pokročilého doporučovacího systému pro e-commerce prostředí. Navržené řešení kombinuje vektorové embeddingy s velkými jazykovými modely (LLM) a řeší klíčové problémy tradičního doporučování, tedy zejména nízkou sémantickou kvalitu doporučení, cold-start u nových produktů a nedostatečné využití textových informací u obsahově bohatých produktů. Výsledkem je produkčně nasazený systém pro e-shop založený na architektuře retrieval–ranking. Retrieval vrstva využívá tři typy embeddingových indexů: produktové, session a transakční, zatímco ranking vrstva používá LLM k finálnímu seřazení kandidátů na základě sémantické relevance. Práce popisuje kompletní datovou architekturu implementovanou v platformě Keboola, včetně čištění dat, generování embeddingů, orchestrace pipeline, validace výstupů a monitoringu kvality. Součástí je důkladná evaluace prostřednictvím A/B testování v produkčním prostředí, která prokázala statisticky významné zlepšení klíčových metrik – míry prokliku (CTR) a konverzního poměru. Práce se věnuje rovněž etickým a bezpečnostním aspektům využití LLM, zejména ochraně soukromí a prevenci halucinací. Výsledky potvrzují, že kombinace embeddingů a velkých jazykových modelů představuje účinný a prakticky nasaditelný přístup pro doporučování produktů v doménách, kde je klíčová sémantická podobnost.
Keywords: velké jazykové modely (LLM); embeddingy; Word2Vec; sémantické doporučování; e-commerce; doporučovací systémy; personalizace; hybridní architektura; A/B testování; cold start; implementace AI
Thesis title: Recommender System Using LLMs in E-commerce
Author: Husičková, Kateřina
Thesis type: Diploma thesis
Supervisor: Zimmermann, Pavel
Opponents: Vencovský, Filip
Thesis language: Česky
Abstract:
This thesis focuses on the design, implementation, and evaluation of an advanced recommender system for an e-commerce environment. The proposed solution combines vector embeddings with large language models (LLMs) to address key limitations of traditional recommendation approaches—particularly low semantic quality of recommendations, the cold-start problem for new products, and insufficient use of textual information for content-rich products. The outcome is a production-deployed system for an e-commerce store based on a retrieval–ranking architecture. The retrieval layer operates over three embedding indexes: product, session, and transaction embeddings, while the ranking layer uses an LLM to produce the final ordering of candidates based on semantic relevance. The thesis describes the complete data architecture implemented on the Keboola platform, including data cleaning, embedding generation, pipeline orchestration, output validation, and quality monitoring. It includes thorough evaluation via A/B testing in a production environment, demonstrating statistically significant improvements in key metrics, an increase in click-through rate (CTR) and an improvement in conversion rate. Furthermore, the thesis discusses ethical and security aspects of using LLMs, focusing on privacy protection and hallucination prevention. The results confirm that combining embeddings with large language models is an effective and practically deployable approach to product recommendation in domains where semantic similarity is crucial.
Keywords: AI implementation; large language models (LLM); embeddings; Word2Vec; semantic recommendation; e-commerce; personalization; hybrid architecture; recommender systems; A/B testing; cold start

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 27. 1. 2025
Date of submission: 29. 11. 2025
Date of defense: 16. 1. 2026
Identifier in the InSIS system: https://insis.vse.cz/zp/91146/podrobnosti

Files for download

Main text
File publication postponed to: 1. 12. 2028
Download
Příloha práce
File publication postponed to: 1. 12. 2028
Download
    Last update: