Gender stereotypes about occupations in natural language

Thesis title: Genderové stereotypy o povolání v přirozeném jazyce
Author: Jadviščoková, Šárka
Thesis type: Bakalářská práce
Supervisor: Bahník, Štěpán
Opponents: Tkáčik, Marcel
Thesis language: Česky
Abstract:
Bakalářská práce je zpracována jakožto replikační studie článku o genderových stereotypech o povolání v přirozeném jazyce. Hlavními oblastmi zkoumání (tj. korpusy) jsou mluva mířená dětem, mluva dospělých a dětí a knihy a audiovizuální média pro děti i dospělé. Cílem práce je detekování asociací mezi jednotlivými profesemi a genderem implicitně zakotvených v textu. V teoretické části jsou popsány pojmy týkající se big dat a machine learning, replikace a replikační krize, genderu a stereotypů a použité analýzy. V praktické části jsou za použití word embeddingů (konkrétně modelu fastText skipgram) analyzovány dané korpusy a výsledné word embeddingy jsou interpretovány pomocí metod meta-analýzy v statistickém softwaru R. Výsledkem práce je nalezení empirického důkazu o genderových stereotypech o povolání v přirozeném jazyce a jejich korelace se skutečnými administrativními statistikami o zastoupení daného genderu v jednotlivých profesích. Práce potvrzuje, že existují konzistentní rozdíly ve vnímání genderu a povolání a jejich síla a zastoupení se nemění v jednotlivých věkových kategoriích. Jelikož se jedná o replikaci článku a v průběhu výzkumu došlo k nesrovnalostem, byl autorům publikace odeslán email s výčtem problémů při replikaci.
Keywords: genderový stereotyp; gender; povolání; word embeddings; fastText skipgram
Thesis title: Gender stereotypes about occupations in natural language
Author: Jadviščoková, Šárka
Thesis type: Bachelor thesis
Supervisor: Bahník, Štěpán
Opponents: Tkáčik, Marcel
Thesis language: Česky
Abstract:
The bachelor thesis is processed as a replication study of an article about gender stereotypes about occupations in natural language. The main areas of research (i.e. corporas) are children's directed speech, children’s and adult speech, and books, and audiovisual media for children and adults. The aim of this study is to detect associations between professions and gender implicitly reflected in the textual sources. The theoretical part describes the concepts related to big data and machine learning, replication and replication crisis, gender, and stereotypes, and the analytical methods used. In the practical part the corporas are analyzed using the fastText Skipgram model. The resulting word embeddings are interpreted using methods of metaanalysis in statistical software R. The result of the work is an empirical evidence that gender stereotypes about occupations appear in natural language and correlate with real labor-office statistics. Exist consistent differences in perceptions of gender stereotypes about professions across corporas, and their strength, and representation do not change across age categories. As this is a replication of the article, and inconsistencies occurred during the research, an email was sent to the authors of the publication listing the problems with replication.
Keywords: gender stereotype; occupation; word embeddings; fastText skipgram; gender

Information about study

Study programme: Ekonomika a management/Podniková ekonomika a management
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Business Administration
Department: Department of Management

Information on submission and defense

Date of assignment: 12. 2. 2021
Date of submission: 12. 5. 2021
Date of defense: 14. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/76362/podrobnosti

Files for download

    Last update: