Predikce ukazatelů interakce čtenářů se zprávami pomocí strojového učení
Autor(ka) práce:
Akhunova, Albina
Typ práce:
Bachelor thesis
Vedoucí práce:
Kliegr, Tomáš
Oponenti práce:
Zimmermann, Pavel
Jazyk práce:
English
Abstrakt:
In the digital environment, where a large number of news articles are published every day, understanding the factors influencing user engagement is crucial for publishers, digital platforms, and advertisers. The level of engagement, expressed for example through the number of comments, shares, or clicks, reflects not only the attractiveness of the content but also its emotional impact and relevance. Predicting this engagement based on textual features allows for estimating the potential success of an article even before its publication. At the same time, it helps publishers find a balance between creating compelling content and maintaining credibility and responsibility towards users. This bachelor’s thesis focuses on predicting user engagement with news using machine learning methods and natural language processing (NLP) techniques. The goal is to develop a model that can predict the expected level of interaction with an article based on textual elements, particularly headlines and teasers. The analysis is based on articles published on the iDNES.cz portal. The thesis combines a theoretical overview of current research with the practical implementation of a machine learning model. In addition to the model’s design and training, the work also evaluates its results and suggests possibilities for further development in the field of user engagement prediction.
Klíčová slova:
News; iDNES.cz; Machine Learning; User Engagement; NLP
Název práce:
Predikce ukazatelů interakce čtenářů se zprávami pomocí strojového učení
Autor(ka) práce:
Akhunova, Albina
Typ práce:
Bakalářská práce
Vedoucí práce:
Kliegr, Tomáš
Oponenti práce:
Zimmermann, Pavel
Jazyk práce:
English
Abstrakt:
V digitálním prostředí, kde je každý den publikováno velké množství zpravodajských článků, je porozumění faktorům ovlivňujícím uživatelskou interakci klíčové pro vydavatele, digitální platformy i inzerenty. Úroveň zapojení, vyjádřená například počtem komentářů, sdílení či kliknutí, odráží nejen atraktivitu obsahu, ale také jeho emocionální dopad a relevanci. Predikce tohoto zapojení na základě textových prvků umožňuje odhadnout potenciální úspěšnost článku ještě před jeho publikací. Současně napomáhá vydavatelům nalézt rovnováhu mezi tvorbou poutavého obsahu a zachováním důvěryhodnosti a odpovědnosti vůči uživatelům. Tato bakalářská práce se zaměřuje na predikci uživatelského zapojení s využitím metod strojového učení a zpracování přirozeného jazyka (NLP). Cílem je vytvořit model, který na základě textových prvků, zejména titulků a perexů, dokáže předpovědět míru očekávané interakce s článkem. Analýza vychází z článků publikovaných na portálu iDNES.cz. Práce kombinuje teoretický přehled současného výzkumu s praktickou implementací modelu strojového učení. Kromě návrhu a trénování modelu se práce věnuje také evaluaci výsledků a navrhuje možnosti dalšího rozvoje v oblasti predikce uživatelského zapojení.