Predicting the rating of scientific papers
Thesis title: | Predikce hodnocení vědeckých prací |
---|---|
Author: | Cap, Ngoc Bao |
Thesis type: | Bakalářská práce |
Supervisor: | Kliegr, Tomáš |
Opponents: | Dvořáčková, Lucie |
Thesis language: | Česky |
Abstract: | Tato bakalářská práce se zabývá predikcí hodnocení vědeckých publikací pomocí metod strojového učení. Hlavním cílem této bakalářské práce je zjistit, s jakou úspěšností lze predikovat recenzní hodnocení vědeckých publikací. Pro dosažení hlavního cíle je provedena rešerše studií zabývající predikcí hodnocení vědeckých publikací. V rámci metodiky jsou popsány softwarové nástroje a knihovny pro aplikování metod strojového učení. Dále je popsán sběr dat a popis datasetů. Také jsou popsány evaluační metriky pro zhodnocení výkonnosti modelů a metody strojového učení. V rámci experimentální části jsou aplikovány tradiční metody strojového učení jako je logistická regrese, lineární regrese, rozhodovací stromy a také rozhraní AutoGluon-Tabular a jazykový model SciBERT. Potom jsou výsledky modelů z experimentální části porovnávány. |
Keywords: | predikce hodnocení; strojové učení; Scientometrie |
Thesis title: | Predicting the rating of scientific papers |
---|---|
Author: | Cap, Ngoc Bao |
Thesis type: | Bachelor thesis |
Supervisor: | Kliegr, Tomáš |
Opponents: | Dvořáčková, Lucie |
Thesis language: | Česky |
Abstract: | This bachelor thesis deals with the prediction of scientific publication ratings using machine learning methods. The main aim of this bachelor thesis is to find out what success can be achieved in predicting the peer review ratings of scientific publications. A search of studies dealing with the prediction of scientific publication reviews is conducted to achieve the main objective. Software tools and libraries for applying machine learning methods are described. Data collection and description of datasets are also described. Evaluation metrics for assessing model performance are also described, as well as machine learning methods. In the experimental part, traditional machine learning methods such as logistic regression, linear regression, decision trees, the AutoGluon-Tabular interface, and the SciBERT language model are applied. Then, the results of the models from the experimental part are compared. |
Keywords: | machine learning; score prediction; Scientometrics |
Information about study
Study programme: | Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 14. 12. 2023 |
---|---|
Date of submission: | 6. 5. 2024 |
Date of defense: | 10. 6. 2024 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/86905/podrobnosti |