Predikce hodnocení vědeckých prací

Název práce: Predikce hodnocení vědeckých prací
Autor(ka) práce: Cap, Ngoc Bao
Typ práce: Bakalářská práce
Vedoucí práce: Kliegr, Tomáš
Oponenti práce: Dvořáčková, Lucie
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zabývá predikcí hodnocení vědeckých publikací pomocí metod strojového učení. Hlavním cílem této bakalářské práce je zjistit, s jakou úspěšností lze predikovat recenzní hodnocení vědeckých publikací. Pro dosažení hlavního cíle je provedena rešerše studií zabývající predikcí hodnocení vědeckých publikací. V rámci metodiky jsou popsány softwarové nástroje a knihovny pro aplikování metod strojového učení. Dále je popsán sběr dat a popis datasetů. Také jsou popsány evaluační metriky pro zhodnocení výkonnosti modelů a metody strojového učení. V rámci experimentální části jsou aplikovány tradiční metody strojového učení jako je logistická regrese, lineární regrese, rozhodovací stromy a také rozhraní AutoGluon-Tabular a jazykový model SciBERT. Potom jsou výsledky modelů z experimentální části porovnávány.
Klíčová slova: predikce hodnocení; strojové učení; Scientometrie
Název práce: Predicting the rating of scientific papers
Autor(ka) práce: Cap, Ngoc Bao
Typ práce: Bachelor thesis
Vedoucí práce: Kliegr, Tomáš
Oponenti práce: Dvořáčková, Lucie
Jazyk práce: Česky
Abstrakt:
This bachelor thesis deals with the prediction of scientific publication ratings using machine learning methods. The main aim of this bachelor thesis is to find out what success can be achieved in predicting the peer review ratings of scientific publications. A search of studies dealing with the prediction of scientific publication reviews is conducted to achieve the main objective. Software tools and libraries for applying machine learning methods are described. Data collection and description of datasets are also described. Evaluation metrics for assessing model performance are also described, as well as machine learning methods. In the experimental part, traditional machine learning methods such as logistic regression, linear regression, decision trees, the AutoGluon-Tabular interface, and the SciBERT language model are applied. Then, the results of the models from the experimental part are compared.
Klíčová slova: machine learning; score prediction; Scientometrics

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 14. 12. 2023
Datum podání práce: 6. 5. 2024
Datum obhajoby: 10. 6. 2024
Identifikátor v systému InSIS: https://insis.vse.cz/zp/86905/podrobnosti

Soubory ke stažení

    Poslední aktualizace: