Generative artificial intelligence in visual content creation

Thesis title: Generativní umělá inteligence vizuálního obsahu
Author: Ložek, David
Thesis type: Bakalářská práce
Supervisor: Černý, Jan
Opponents: Molnár, Zdeněk
Thesis language: Česky
Abstract:
Cílem práce je poskytnout ucelený přehled o stávajících metodách a technikách umělé inteligence, které umožňují generování obrazových dokumentů, a to s důrazem na modely DALL·E a Midjourney. V teoretické části je představena obecná struktura a principy fungování generativních modelů, jejich trénování a mechanismy, díky kterým je možné generovat nový vizuální obsah na základě uživatelských pokynů. Praktická část práce se věnuje experimentálnímu testování a porovnání výkonu vybraných modelů v rámci generování vizuálního obsahu. Zkoumána je nejen kvalita a relevantnost vygenerovaných obrazů vůči zadání (promptům), ale i efektivita a limitace jednotlivých systémů. Prompt engineering, proces optimalizace uživatelských pokynů pro získání co nejlepších výsledků, je představen jako klíčová dovednost pro efektivní využívání generativních AI modelů. Výsledky a zjištění mohou sloužit jako vodítko pro budoucí výzkum, vývoj a aplikace generativní AI v různých oblastech, zejména pak marketing.
Keywords: Generativní umělá inteligence; Umělá inteligence; Prompt engineering; DALL·E; Midjourney
Thesis title: Generative artificial intelligence in visual content creation
Author: Ložek, David
Thesis type: Bachelor thesis
Supervisor: Černý, Jan
Opponents: Molnár, Zdeněk
Thesis language: Česky
Abstract:
The aim of this bachelor thesis is to provide a comprehensive overview of existing methods and techniques of artificial intelligence that enable the generation of visual documents, with an emphasis on the DALL·E and Midjourney models. The theoretical part introduces the general structure and principles of operation of generative models, their training process and mechanisms that allow generating new visual content based on user instructions. The practical part of the work focuses on experimental testing and comparison of the performance of selected models in visual content generation. Not only the quality and relevance of the generated images in relation to the prompts will be examined, but also the effectiveness and limitations of individual systems. Prompt engineering, the process of optimizing user instructions to achieve the best results, is introduced as a key skill for effectively utilizing generative AI models. The results and findings can serve as a guide for future research, development, and applications of generative AI in various fields, especially marketing.
Keywords: Generative artificial intelligence; Artificial intelligence; Prompt engineering; DALL·E; Midjourney

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 1. 4. 2024
Date of submission: 6. 5. 2024
Date of defense: 19. 6. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/88383/podrobnosti

Files for download

    Last update: