Image classification using machine learning methods
Autor(ka) práce:
Tatarinov, Vadym
Typ práce:
Bachelor thesis
Vedoucí práce:
Veverka, Lukáš
Oponenti práce:
Kavřík, Dominik
Jazyk práce:
English
Abstrakt:
Recent advancements in deep learning have changed computer vision, evolving from traditional methods like Support Vector Machines (SVM) to Convolutional Neural Networks (CNN) in 2012, and more recently to Vision Transformers (ViT) in 2021. Simultaneously, improvements in computational power and the exponential growth of internet data have further driven this progress. This work uses these developments to build a computer vision model for classifying damaged and undamaged cars. Specifically, the study compares pre-trained convolutional neural networks, such as ResNet and ConvNeXt, to find the best-performing architecture for this task. Key contributions of this work include an analysis of the impact of data quantity and quality on model performance, the balance between computational resources and accuracy, and an exploration of hyperparameter optimization strategies for this application. The model's performance was evaluated using metrics like accuracy, model size, and F1 score, with ConvNeXt achieving a maximum accuracy of 95.4\%, demonstrating its effectiveness in binary classification for this task. The final model from this study could be applied to online platforms or auctions for selling used cars, potentially enhancing ad conversion rates, improving user experience, and reducing fraud associated with selling damaged vehicles.
Klíčová slova:
Car damage detection; Computer vision; Image recognition; Image classification
Název práce:
Klasifikace obrázků pomocí metod strojového učení
Autor(ka) práce:
Tatarinov, Vadym
Typ práce:
Bakalářská práce
Vedoucí práce:
Veverka, Lukáš
Oponenti práce:
Kavřík, Dominik
Jazyk práce:
English
Abstrakt:
Nedávné pokroky v oblasti hlubokého učení změnily počítačové vidění, které se vyvinulo z tradičních metod, jako je Support Vector Machines (SVM), na konvoluční neuronové sítě (CNN) v roce 2012 a nedávno na Vision Transformers (ViT) v roce 2021. Současně tento pokrok dále podpořilo zlepšení výpočetního výkonu a exponenciální nárůst internetových dat. Tato práce využívá tohoto vývoje k vytvoření modelu počítačového vidění pro klasifikaci poškozených a nepoškozených automobilů. Konkrétně studie porovnává předtrénované konvoluční neuronové sítě, jako jsou ResNet a ConvNeXt, s cílem najít pro tuto úlohu nejvýkonnější architekturu. Mezi hlavní přínosy této práce patří analýza vlivu množství a kvality dat na výkonnost modelu, rovnováha mezi výpočetními zdroji a přesností a zkoumání strategií optimalizace hyperparametrů pro tuto aplikaci. Výkonnost modelu byla hodnocena pomocí ukazatelů, jako je přesnost, velikost modelu a skóre F1, přičemž ConvNeXt dosáhl maximální přesnosti 95,4 %, což dokazuje jeho účinnost při binární klasifikaci pro tuto úlohu. Konečný model z této studie by mohl být použit na online platformách nebo aukcích pro prodej ojetých automobilů, což by mohlo zvýšit míru konverze reklamy, zlepšit uživatelskou zkušenost a omezit podvody spojené s prodejem poškozených vozidel.
Klíčová slova:
Počítačové vidění; Rozpoznávání obrazu; Klasifikace obrazu; Detekce poškození automobilu