Data mining je nová disciplína, která se objevuje s rostoucím množstvím ukládaných dat a s rostoucí potřebou získat informace v nich ukryté. Zabývá se extrahováním potenciálně užitečných informací z velkých datových souborů a leží na pomezí statistiky, strojového učení, umělé inteligence, databází a dalších oborů. Cílem této diplomové práce je představit celý proces data miningu s důrazem na jeho spojitost se statistikou a popsat vybrané statistické metody, které se v této oblasti hodně používaj... show full abstractData mining je nová disciplína, která se objevuje s rostoucím množstvím ukládaných dat a s rostoucí potřebou získat informace v nich ukryté. Zabývá se extrahováním potenciálně užitečných informací z velkých datových souborů a leží na pomezí statistiky, strojového učení, umělé inteligence, databází a dalších oborů. Cílem této diplomové práce je představit celý proces data miningu s důrazem na jeho spojitost se statistikou a popsat vybrané statistické metody, které se v této oblasti hodně používají a které jsou v práci aplikovány na vlastní řešení dataminingového problému. Na reálných datech o nákupech v internetovém obchodě je ukázáno, že využití různých metod přináší různé výsledky a zajímavé poznatky o nákupním chování, a také vede k dokázání, že ne všechny metody jsou vždy použitelné na všechny typy úloh. |