Generative AI for Video Creation
| Thesis title: | Generativní AI pro tvorbu videí |
|---|---|
| Author: | Chervets, Mark |
| Thesis type: | Bakalářská práce |
| Supervisor: | Berka, Petr |
| Opponents: | Svoboda, Jaroslav |
| Thesis language: | Česky |
| Abstract: | Tato bakalářská práce se zabývá fenoménem generativní umělé inteligence se zaměřením na syntézu a tvorbu videa. Cílem práce je zhodnotit aktuální technologické možnosti předních video modelů (Google Veo 3.1, Kling 2.6, Hailuo MiniMax 2.3 a Runway Gen-4.5) a analyzovat jejich celospolečenské důsledky. Text práce je koncipován do tří hlavních částí. Teoretická část práce mapuje historický vývoj generativních systémů a představuje různé modality jejich výstupů. Následně vymezuje aplikační využití generativní umělé inteligence napříč různými doménami se zvláštním zřetelem na tvorbu videoobsahu. Detailně jsou zde vysvětleny technické principy fungování klíčových architektur, konkrétně generativních ad-versariálních sítí (GAN), variačních autoenkodérů (VAE), autoregresních modelů, transformerů a difuzních sítí. Na tento teoretický základ navazuje systematický přehled současných nástrojů pro tvorbu videa, které jsou kategorizovány právě na základě své vnitřní technologické architektury. Praktická část se opírá o kvalitativní výzkum a komparativní vizuální analýzu vycházející z metodiky VBench. Testování v šesti zátěžových scénářích odhalilo, že ačkoliv statická vizuální kvalita dosahuje fotorealismu, modely se zásadně liší v kognitivním porozumění prostoru a zvládání fyziky. Byly identifikovány tři dominantní chybové vzorce současné technologie: lokální rozmazání v pohybu, povrchové vlnění textur a sémantické zploštění. Závěrečná část se věnuje společenským a etickým dopadům generativního AI videa. Za využití výsledků z praktického etického testování analyzuje rizika spojená s tvorbou deepfakes a dezinformací, přičemž poukazuje na diametrální rozdíly v bezpečnostních filtrech jednotlivých nástrojů. Dále se zabývá problematikou autorského práva a vlivem umělé inteligence na trh práce v kreativním průmyslu. Výstupem práce jsou ucelené technologické profily testovaných modelů, které definují jejich využitelnost a bezpečnostní rizika v profesionální praxi. |
| Keywords: | generativní AI; komparativní analýza; deepfakes; VBench; difuzní modely; etika AI; tvorba videa |
| Thesis title: | Generative AI for Video Creation |
|---|---|
| Author: | Chervets, Mark |
| Thesis type: | Bachelor thesis |
| Supervisor: | Berka, Petr |
| Opponents: | Svoboda, Jaroslav |
| Thesis language: | Česky |
| Abstract: | This bachelor thesis explores the phenomenon of generative artificial intelligence with a focus on video synthesis and creation. The aim of the thesis is to evaluate the current technological capabilities of leading video models (Google Veo 3.1, Kling 2.6, Hailuo MiniMax 2.3, and Runway Gen-4.5) and analyze their broader societal implications. The text is structured into three main parts. The theoretical part of the thesis maps the historical development of generative systems and presents the various modalities of their outputs. Subsequently, it defines the application of generative artificial intelligence across different domains, with a special focus on video content creation. The technical principles underlying key architectures are explained in detail, specifically Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs), autoregressive models, transformers, and diffusion networks. This theoretical foundation is followed by a systematic overview of current video generation tools, which are categorized based on their underlying technological architecture. The practical part is based on qualitative research and comparative visual analysis derived from the VBench methodology. Testing across six stress scenarios revealed that while static visual quality reaches photorealism, the models differ fundamentally in their cognitive understanding of space and handling of dynamic physics. Three dominant error patterns of current technology were identified: local detail blurring in motion (smudging), surface texture swimming, and semantic spatial flattening. The final part examines the societal and ethical impacts of generative AI video. Utilizing the results from the practical ethical testing, it analyzes the risks associated with deepfakes and disinformation, highlighting diametrical differences in the safety filters of the individual tools. Furthermore, it addresses copyright issues and the impact of artificial intelligence on the labor market in the creative industry. The output of the thesis consists of comprehensive technological profiles of the tested models, defining their applicability and security risks in professional practice. |
| Keywords: | generative AI; video generation; diffusion models; VBench; comparative analysis; AI ethics; deepfakes |
Information about study
| Study programme: | Aplikovaná informatika |
|---|---|
| Type of study programme: | Bakalářský studijní program |
| Assigned degree: | Bc. |
| Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
| Faculty: | Faculty of Informatics and Statistics |
| Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
| Date of assignment: | 16. 4. 2026 |
|---|---|
| Date of submission: | 20. 4. 2026 |
| Date of defense: | 19. 6. 2026 |
| Identifier in the InSIS system: | https://insis.vse.cz/zp/96273/podrobnosti |