Predicting the rating of scientific papers

Thesis title: Predikce hodnocení vědeckých prací
Author: Cap, Ngoc Bao
Thesis type: Bakalářská práce
Supervisor: Kliegr, Tomáš
Opponents: Dvořáčková, Lucie
Thesis language: Česky
Abstract:
Tato bakalářská práce se zabývá predikcí hodnocení vědeckých publikací pomocí metod strojového učení. Hlavním cílem této bakalářské práce je zjistit, s jakou úspěšností lze predikovat recenzní hodnocení vědeckých publikací. Pro dosažení hlavního cíle je provedena rešerše studií zabývající predikcí hodnocení vědeckých publikací. V rámci metodiky jsou popsány softwarové nástroje a knihovny pro aplikování metod strojového učení. Dále je popsán sběr dat a popis datasetů. Také jsou popsány evaluační metriky pro zhodnocení výkonnosti modelů a metody strojového učení. V rámci experimentální části jsou aplikovány tradiční metody strojového učení jako je logistická regrese, lineární regrese, rozhodovací stromy a také rozhraní AutoGluon-Tabular a jazykový model SciBERT. Potom jsou výsledky modelů z experimentální části porovnávány.
Keywords: predikce hodnocení; strojové učení; Scientometrie
Thesis title: Predicting the rating of scientific papers
Author: Cap, Ngoc Bao
Thesis type: Bachelor thesis
Supervisor: Kliegr, Tomáš
Opponents: Dvořáčková, Lucie
Thesis language: Česky
Abstract:
This bachelor thesis deals with the prediction of scientific publication ratings using machine learning methods. The main aim of this bachelor thesis is to find out what success can be achieved in predicting the peer review ratings of scientific publications. A search of studies dealing with the prediction of scientific publication reviews is conducted to achieve the main objective. Software tools and libraries for applying machine learning methods are described. Data collection and description of datasets are also described. Evaluation metrics for assessing model performance are also described, as well as machine learning methods. In the experimental part, traditional machine learning methods such as logistic regression, linear regression, decision trees, the AutoGluon-Tabular interface, and the SciBERT language model are applied. Then, the results of the models from the experimental part are compared.
Keywords: machine learning; score prediction; Scientometrics

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 14. 12. 2023
Date of submission: 6. 5. 2024
Date of defense: 10. 6. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/86905/podrobnosti

Files for download

    Last update: