An Analysis of Popularity of YouTube Videos Based on Upload Frequency

Thesis title: Analýza popularity YouTube videí v závislosti na frekvenci jejich publikování
Author: Šot, Petr
Thesis type: Bakalářská práce
Supervisor: Šulc, Zdeněk
Opponents: Jirsa, Ladislav
Thesis language: Česky
Abstract:
Cílem této práce je analýza výběru velkého množství pozorování z rozsáhlého datasetu obsahujícího veřejně dostupné informace o profilech a videích z webu YouTube obohacené o interní data firmy Emplifi pro analytické účely. Jedná se o 762 525 videí vydaných mezi 9.8.2021 a 9.8.2022 v kategorii zábavního průmyslu na YouTube. V práci je vymezena vhodná metodologie a diskutována aplikovatelnost statistických metod pro práci s reálnými velkými daty. Data jsou popsána a podrobena explorační analýze za účelem seznámení se s datasetem a porozumění jeho obsahu, provedené pomocí grafů a popisných statistik. Následně je využito metod analýzy rozptylu, korelace a regrese, které budou komentovány jak teoreticky, tak prakticky interpretovány na základě věcného významu. Samotná analýza je provedena pomocí programovacího jazyka Python. Konkrétní zaměření práce je na zkoumání pravidelnosti a frekvence nahrávání videí a jejich vlivu na jejich úspěšnost, s cílem objasnit tento aspekt fungování YouTube algoritmu a spotřebitelského prostředí na YouTube. Výsledky analýz nesvědčí ve prospěch významného vlivu pravidelnosti na úspěšnost videí, ani ve prospěch vyšší úspěšnosti videí daného kanálu založené čistě na jejich kvantitě.
Keywords: YouTube; analýza reálných dat; zábavní průmysl; big data; YouTube algoritmus; frekvence nahrávání; pravidelné nahrávání; velikost účinku; korelace
Thesis title: An Analysis of Popularity of YouTube Videos Based on Upload Frequency
Author: Šot, Petr
Thesis type: Bachelor thesis
Supervisor: Šulc, Zdeněk
Opponents: Jirsa, Ladislav
Thesis language: Česky
Abstract:
The aim of this thesis is to analyze a selection of a large number of observations from a dataset containing publicly available information about YouTube profiles and videos enriched with Emplifi's internal data for analytical purposes. This includes 762,525 videos released between August 9, 2021, and August 9, 2022, in the entertainment category on YouTube. The paper defines the appropriate methodology and discusses the applicability of statistical methods when working with real, big data. The data is described and subjected to exploratory analysis to get acquainted with the dataset and understand its content, performed using graphs and descriptive statistics. Subsequently, methods of analysis of variance, correlation and regression are used and will be commented on theoretically, and practically interpreted based on their real-life significance. The analysis is performed using the Python programming language. The specific focus of the thesis is on the investigation of regularity and frequency of video uploads and the impact on their success rate, in order to shed light on this aspect of the YouTube algorithm and the YouTube consumer environment. Results of the analyses do not speak in favor of a significant effect of regularity on the success rate of videos measured by their views, nor in favor of a higher success rate for a given channel's videos based purely on their quantity.
Keywords: YouTube; real data analysis; entertainment business; big data; YouTube algorithm; upload frequency; regular uploading; effect size; correlation

Information about study

Study programme: Matematické metody v ekonomii/Datové analýzy a modelování
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 30. 8. 2022
Date of submission: 4. 5. 2023
Date of defense: 13. 6. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/81272/podrobnosti

Files for download

    Last update: