Image classification using machine learning methods

Thesis title: Image classification using machine learning methods
Author: Tatarinov, Vadym
Thesis type: Bachelor thesis
Supervisor: Veverka, Lukáš
Opponents: Kavřík, Dominik
Thesis language: English
Abstract:
Recent advancements in deep learning have changed computer vision, evolving from traditional methods like Support Vector Machines (SVM) to Convolutional Neural Networks (CNN) in 2012, and more recently to Vision Transformers (ViT) in 2021. Simultaneously, improvements in computational power and the exponential growth of internet data have further driven this progress. This work uses these developments to build a computer vision model for classifying damaged and undamaged cars. Specifically, the study compares pre-trained convolutional neural networks, such as ResNet and ConvNeXt, to find the best-performing architecture for this task. Key contributions of this work include an analysis of the impact of data quantity and quality on model performance, the balance between computational resources and accuracy, and an exploration of hyperparameter optimization strategies for this application. The model's performance was evaluated using metrics like accuracy, model size, and F1 score, with ConvNeXt achieving a maximum accuracy of 95.4\%, demonstrating its effectiveness in binary classification for this task. The final model from this study could be applied to online platforms or auctions for selling used cars, potentially enhancing ad conversion rates, improving user experience, and reducing fraud associated with selling damaged vehicles.
Keywords: Car damage detection; Computer vision; Image recognition; Image classification
Thesis title: Klasifikace obrázků pomocí metod strojového učení
Author: Tatarinov, Vadym
Thesis type: Bakalářská práce
Supervisor: Veverka, Lukáš
Opponents: Kavřík, Dominik
Thesis language: English
Abstract:
Nedávné pokroky v oblasti hlubokého učení změnily počítačové vidění, které se vyvinulo z tradičních metod, jako je Support Vector Machines (SVM), na konvoluční neuronové sítě (CNN) v roce 2012 a nedávno na Vision Transformers (ViT) v roce 2021. Současně tento pokrok dále podpořilo zlepšení výpočetního výkonu a exponenciální nárůst internetových dat. Tato práce využívá tohoto vývoje k vytvoření modelu počítačového vidění pro klasifikaci poškozených a nepoškozených automobilů. Konkrétně studie porovnává předtrénované konvoluční neuronové sítě, jako jsou ResNet a ConvNeXt, s cílem najít pro tuto úlohu nejvýkonnější architekturu. Mezi hlavní přínosy této práce patří analýza vlivu množství a kvality dat na výkonnost modelu, rovnováha mezi výpočetními zdroji a přesností a zkoumání strategií optimalizace hyperparametrů pro tuto aplikaci. Výkonnost modelu byla hodnocena pomocí ukazatelů, jako je přesnost, velikost modelu a skóre F1, přičemž ConvNeXt dosáhl maximální přesnosti 95,4 %, což dokazuje jeho účinnost při binární klasifikaci pro tuto úlohu. Konečný model z této studie by mohl být použit na online platformách nebo aukcích pro prodej ojetých automobilů, což by mohlo zvýšit míru konverze reklamy, zlepšit uživatelskou zkušenost a omezit podvody spojené s prodejem poškozených vozidel.
Keywords: Počítačové vidění; Rozpoznávání obrazu; Klasifikace obrazu; Detekce poškození automobilu

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Econometrics

Information on submission and defense

Date of assignment: 12. 7. 2023
Date of submission: 8. 12. 2024
Date of defense: 2024

Files for download

The files will be available after the defense of the thesis.

    Last update: