Predikce ukazatelů interakce čtenářů se zprávami pomocí strojového učení

Thesis title: Predikce ukazatelů interakce čtenářů se zprávami pomocí strojového učení
Author: Akhunova, Albina
Thesis type: Bachelor thesis
Supervisor: Kliegr, Tomáš
Opponents: Zimmermann, Pavel
Thesis language: English
Abstract:
In the digital environment, where a large number of news articles are published every day, understanding the factors influencing user engagement is crucial for publishers, digital platforms, and advertisers. The level of engagement, expressed for example through the number of comments, shares, or clicks, reflects not only the attractiveness of the content but also its emotional impact and relevance. Predicting this engagement based on textual features allows for estimating the potential success of an article even before its publication. At the same time, it helps publishers find a balance between creating compelling content and maintaining credibility and responsibility towards users. This bachelor’s thesis focuses on predicting user engagement with news using machine learning methods and natural language processing (NLP) techniques. The goal is to develop a model that can predict the expected level of interaction with an article based on textual elements, particularly headlines and teasers. The analysis is based on articles published on the iDNES.cz portal. The thesis combines a theoretical overview of current research with the practical implementation of a machine learning model. In addition to the model’s design and training, the work also evaluates its results and suggests possibilities for further development in the field of user engagement prediction.
Keywords: News; iDNES.cz; Machine Learning; User Engagement; NLP
Thesis title: Predikce ukazatelů interakce čtenářů se zprávami pomocí strojového učení
Author: Akhunova, Albina
Thesis type: Bakalářská práce
Supervisor: Kliegr, Tomáš
Opponents: Zimmermann, Pavel
Thesis language: English
Abstract:
V digitálním prostředí, kde je každý den publikováno velké množství zpravodajských článků, je porozumění faktorům ovlivňujícím uživatelskou interakci klíčové pro vydavatele, digitální platformy i inzerenty. Úroveň zapojení, vyjádřená například počtem komentářů, sdílení či kliknutí, odráží nejen atraktivitu obsahu, ale také jeho emocionální dopad a relevanci. Predikce tohoto zapojení na základě textových prvků umožňuje odhadnout potenciální úspěšnost článku ještě před jeho publikací. Současně napomáhá vydavatelům nalézt rovnováhu mezi tvorbou poutavého obsahu a zachováním důvěryhodnosti a odpovědnosti vůči uživatelům. Tato bakalářská práce se zaměřuje na predikci uživatelského zapojení s využitím metod strojového učení a zpracování přirozeného jazyka (NLP). Cílem je vytvořit model, který na základě textových prvků, zejména titulků a perexů, dokáže předpovědět míru očekávané interakce s článkem. Analýza vychází z článků publikovaných na portálu iDNES.cz. Práce kombinuje teoretický přehled současného výzkumu s praktickou implementací modelu strojového učení. Kromě návrhu a trénování modelu se práce věnuje také evaluaci výsledků a navrhuje možnosti dalšího rozvoje v oblasti predikce uživatelského zapojení.
Keywords: Strojové Učení; iDNES.cz; NLP; Zprávy; Uživatelská Interakce

Information about study

Study programme: Data Analytics
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 18. 1. 2025
Date of submission: 7. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: