Generování audiovizuálního obsahu pomocí AI pro platformu Vyslovuj.cz
Autor(ka) práce:
Renc, Jan
Typ práce:
Závěrečná práce - Institut celoživotního vzdělávání
Vedoucí práce:
Vencovský, Filip
Oponenti práce:
-
Jazyk práce:
Česky
Abstrakt:
Práce se zabývá návrhem, pilotní implementací a validací technického řešení pro automatizovanou tvorbu logopedických výukových videí s využitím nástrojů umělé inteligence pro vzdělávací platformu Vyslovuj.cz. Hlavním cílem je ověřit, zda lze audiovizuální obsah pro logopedická cvičení v českém jazyce generovat strojově tak, aby splňoval požadavky na jazykovou a vizuální kvalitu, a současně byl produkčně škálovatelný a ekonomicky efektivní, neboť současná manuální produkce založená na práci herců a postprodukci je časově i finančně náročná. Práce porovnává dvě technologické cesty – využití komerčních AI platforem dostupných přes API a vývoj vlastního řešení založeného na open-source modelech – a hodnotí je z hlediska technické proveditelnosti, nároků na provoz, kvality generovaných výstupů i vhodnosti pro integraci do workflow platformy. Pilotní testování na sadě českých slov se zaměřilo na srozumitelnost a přirozenost syntetizované řeči, přesnost vizuální artikulace a stabilitu procesu. Výsledky ukazují, že komerční nástroje představují nejvhodnější variantu pro rychlé ověření konceptu a tvorbu MVP, zatímco open-source přístup nabízí potenciál vyšší míry kontroly a dlouhodobé flexibility, avšak za cenu výrazně vyšších nároků na výpočetní výkon i technickou kompetenci. Práce tak poskytuje analytický a metodický rámec pro rozhodování mezi externím a interním technologickým přístupem v oblasti AI-generovaného vzdělávacího obsahu.
Generating audiovisual content using AI for the Vyslovuj.cz platform
Autor(ka) práce:
Renc, Jan
Typ práce:
Závěrečná práce - Institut celoživotního vzdělávání
Vedoucí práce:
Vencovský, Filip
Oponenti práce:
-
Jazyk práce:
Česky
Abstrakt:
The thesis presents the design, pilot implementation, and validation of a technical solution for automated generation of speech-therapy educational videos using artificial intelligence, developed for the educational platform Vyslovuj.cz. The main objective is to determine whether audiovisual content for Czech-language speech-therapy exercises can be generated automatically while meeting linguistic and visual quality requirements, and at the same time remaining scalable and economically efficient, given that current manual production—based on recording actors and post-processing—is both time-consuming and costly. The work compares two technological approaches: the use of commercial AI platforms available via API, and the development of an in-house solution based on open-source models. Both approaches are evaluated in terms of technical feasibility, operational demands, output quality, and suitability for integration into the platform’s workflow. Pilot testing on a set of Czech words focused on speech intelligibility, naturalness of the synthesized voice, accuracy of visual articulation, and overall process stability. The results show that commercial tools are the most practical option for rapid concept validation and MVP development, while the open-source approach offers long-term potential for greater control and flexibility, though at the cost of substantially higher compute requirements and technical complexity. The thesis thus provides an analytical and methodological framework for deciding between external and internal technological approaches in the field of AI-generated educational content.
Klíčová slova:
video generation; open-source models; API integration; Text-to-speech; automation; Vyslovuj.cz; Text-to-video; AI; speech therapy