Aplikace systému LISp-Miner a data mining technik na reálná podniková data

Název práce: Application of LISp-Miner system and data mining techniques on real-life business data
Autor(ka) práce: Fuka, Dominik
Typ práce: Diploma thesis
Vedoucí práce: Rauch, Jan
Oponenti práce: Máša, Petr
Jazyk práce: English
Abstrakt:
This thesis explores a practical application of the LISp-Miner system in combination with the CRISP-DM methodology to evaluate e-commerce data from Butterfly Playing Cards, s.r.o., a small Czech company. It operates two online stores - Butterfly Magic Store (BMS) and Butterfly Wonderland (BW) - each serving a different market (international and Czech). The aim of the thesis was to examine how could LISp-Miner help introduce data mining to a real-world business with limited resources for data analyst. The research followed the CRISP-DM structure. It went through phases of business understanding, data preparation, modeling, evaluation, and planning the deployment. Several analytical questions were formed in collaboration with the store manager to create the goals of the analysis. These questions focused on optimizing free shipping thresholds for EU and rest of the world, identifying frequently purchased product combinations, trying to uncover product preferences in different countries, and confirming seasonal sales patterns. Real-life datasets were exported from the Shoptet platform. Some preprocessing was done in Excel and Python before import to LISp-Miner. Then, the data was imported into LISp- Miner where attributes and tasks were created. CF-Miner, 4ft-Miner, SD4ft-Miner, and SDCF-Miner modules were utilized to generate findings. The analysis confirmed, among other insights, that a significant number of customers do not get motivated by free shipping thresholds, and that there are some opportunities for product bundles and marketing adjustments. Despite limitations of the thesis, such as incomplete or noisy data attributes, GDPR-related exclusion of attributes, and Shoptet export constraints, the thesis demonstrated that a transparent and replicable data mining process is possible to establish even in a small developing company. The results provide not only immediate business insights but also a reusable analytical framework. This work can contribute to the current discussion on the value of interpretable data mining in business decision-making. It can also offer a practical guide for similar organizations looking into leveraging their data.
Klíčová slova: LISp-Miner; GUHA; data mining; CRISP-DM; business data
Název práce: Aplikace systému LISp-Miner a data mining technik na reálná podniková data
Autor(ka) práce: Fuka, Dominik
Typ práce: Diplomová práce
Vedoucí práce: Rauch, Jan
Oponenti práce: Máša, Petr
Jazyk práce: English
Abstrakt:
Tato práce se zabývá praktickou aplikací systému LISp-Miner v kombinaci s metodikou CRISP-DM pro vyhodnocení dat e-shopu menší české společnosti Butterfly Playing Cards, s.r.o.. Ta provozuje dva internetové obchody - Butterfly Magic Store (BMS) a Butterfly Wonderland (BW) - každý z nich obsluhuje jiný trh (mezinárodní a český). Cílem práce bylo zjistit, jak by mohl LISp-Miner pomoci zavést data mining do reálného podnikového prostředí s omezenými zdroji pro datového analytika. Výzkum probíhal podle struktury CRISP-DM. Procházel fázemi porozumění podnikových dat, přípravy těchto dat, modelování, vyhodnocení a plánování nasazení. Ve spolupráci s manažerem prodejny bylo vytvořeno několik analytických otázek, na jejichž základě byly vytvořeny cíle analýz. Tyto otázky se zaměřovaly na optimalizaci limitů pro dopravu zdarma pro EU a zbytek světa, identifikaci často nakupovaných kombinací produktů, snahu odhalit preference produktů v různých zemích a potvrzení sezónních vzorců prodeje. Z platformy Shoptet byly exportovány soubory dat z reálného systému. Před importem do programu LISp-Miner bylo provedeno různé předběžné zpracování dat za využití Excelu a Pythonu. Poté byla data importována do LISp-Mineru, kde byly vytvořeny potřebné atributy a úlohy. K nalezení závěrů byly použity moduly CF-Miner, 4ft-Miner, SD4ft-Miner a SDCFMiner. Analýza mimo jiné potvrdila poznatky, že značný počet zákazníků se nenechá motivovat prahovými hodnotami dopravy zdarma a že existuje několik příležitostí pro tvorbu sad produktů a úpravu marketingové komunikace. I přes zjištěná omezení práce, jako jsou neúplné atributy nebo data obsahující mnoho nerelevatních hodnot, nezahrnutí atributů v souvislosti s GDPR či softwarových omezení exportu z Shoptetu, práce prokázala, že je možné zavést replikovatelný proces dolování dat i v malé rozvíjející se firmě. Výsledky poskytují nejen ihned zaveditelné závěry a poznatky, ale také opakovaně použitelný analytický rámec. Tato práce může přispět k současné diskusi o hodnotě interpretovatelného data miningu v rozhodování firem. Může také nabídnout praktickou ukázku pro podobné organizace, které by chtěli využít svá data ke zlepšení fungování.
Klíčová slova: LISp-Miner; CRISP-DM; data mining; podniková data; GUHA

Informace o studiu

Studijní program / obor: Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 9. 10. 2024
Datum podání práce: 5. 5. 2025
Datum obhajoby: 12. 6. 2025
Identifikátor v systému InSIS: https://insis.vse.cz/zp/89849/podrobnosti

Soubory ke stažení

    Poslední aktualizace: