Loosely Symmetric Neural Network Implementation
Název práce: | Loosely Symmetric Neural Network Implementation |
---|---|
Autor(ka) práce: | Formánková, Lucie |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Kliegr, Tomáš |
Oponenti práce: | Berka, Petr |
Jazyk práce: | English |
Abstrakt: | Insufficient or imbalanced data are a common issue, e.g., in healthcare where the data is limited to protect personal data and privacy. This imbalance results in classifiers' poor performance as they usually prioritize the majority class during classification. The artificial neural network requires a large amount of well-prepared balanced data. Human beings, on the other hand, can extract new information even from a few. This thesis deals with the implementation of cognitive biases into neural networks, which should help the model imitate human learning. The loosely symmetric model designed by Taniguchi et al. had been tested before by authors in the language R and achieved the best results from all tested models. During this thesis, the implementation was created in Python as there is no other available. The thesis contains a theoretical introduction to machine learning, the fit algorithm of the neural network, the loosely symmetric model description, including created variants, and the evaluation. During the evaluation of the spam classification, the new LSNN implementation managed to keep up with the model LSNB and even achieved better performance than the eLSNB model, which performed best on the same dataset in previous research. However, the method of "enhancement" is not clearly explained in the original description. Therefore, it is unknown whether this model is the correct implementation of the original design of the LSNN model. This implementation of the LSNN model proved its potential. However, the fit process could be further extended with the method of early stopping. |
Klíčová slova: | cognitive biases; imbalanced data; artificial neural network; spam |
Název práce: | Loosely Symmetric Neural Network Implementation |
---|---|
Autor(ka) práce: | Formánková, Lucie |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Kliegr, Tomáš |
Oponenti práce: | Berka, Petr |
Jazyk práce: | English |
Abstrakt: | Nedostatečná nebo nevyrovnaná data jsou častým problémem např. ve zdravotnictví, kde jsou data omezena kvůli ochraně osobních údajů a soukromí. Takovýto nepoměr má za následek snížení výkonnosti klasifikátorů, protože často dávají přednost klasifikaci majoritní třídy. Umělá neuronová síť při učení vyvažuje velké množství dobře připravených vyvážených dat. Naproti tomu lidé dokážou získat novou informaci i z mála dat. Tato práce se zabývá implementací kognitivních zkreslení do neuronových sítí, díky které by měl model více napodobovat lidský způsob učení. Model loosely symmetric neural network navržený Taniguchi et al. už byl dříve otestovaný autory v jazyce R a dosáhl nejlepších výsledků z ostatních testovaných. Protože implementace není dostupná, během této práci došlo k jejímu vytvoření v jazyce Python. Práce obsahuje teoretický úvod do strojového učení, popis algoritmu učení neuronových sítí a loosely symmetric modelu včetně vytvořených variant, a evaluaci. Během evaluace na problematice klasifikace spamu, nová implementace LSNN dokázala držet krok s modelem LSNB a dokonce měla lepší výsledky než model eLSNB, který byl dříve vyhodnocen na stejném datasetu jako nejlepší. Způsob „vylepšení“, ale není v původním popise jednoznačně vysvětlen. Není proto jasné, zda je model správnou implementací původního návrhu modelu LSNN. Tato implementace LSNN modelu dokázala svůj potenciál, proces učení by ale mohl být dále vylepšen doplněním metody předčasného ukončení trénování. |
Klíčová slova: | umělá neuronová síť; kognitivní zkreslení; nevyvážená data; spam |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 9. 7. 2020 |
---|---|
Datum podání práce: | 9. 5. 2021 |
Datum obhajoby: | 14. 6. 2021 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/73714/podrobnosti |