Využití veřejně dostupných datových souborů ve statistické analýze

Název práce: Využití veřejně dostupných datových souborů ve statistické analýze
Autor(ka) práce: Janečková, Monika
Typ práce: Bakalářská práce
Vedoucí práce: Danko, Jakub
Oponenti práce: Löster, Tomáš
Jazyk práce: Česky
Abstrakt:
Neustále rostoucí množství veřejně dostupných zdrojů představuje určitou výhodu při volbě datového souboru, který bude vhodný pro demonstraci statistických analýz. Tato bakalářská práce se zaměřuje na využití veřejně dostupných datových souborů ve výuce statistických předmětů. Hlavním cílem práce je nalezení datových souborů, které jsou vhodné pro konkrétní statistické metody, a jejich následná kategorizace. Teoretická část popisuje veřejně dostupné datové zdroje a statistické metody včetně statistických hypotéz, předpokladů a matematických vztahů. Praktická část se věnuje předvedení vybraných statistických analýz – analýze rozptylu, kontingenčním tabulkám a regresní analýze. Tyto analýzy jsou provedeny v kombinaci statistických softwarů MS Excel a Statgraphics. Výsledky jsou doplněny o interpretaci jednotlivých výstupů. Závěrem jsou doporučení pro využití datových souborů, které jsou vhodné pro ukázku již zmíněných statistických metod. Jedná se o cenný přínos pro studenty, ale také pedagogy, kteří hledají datové soubory vhodné pro rozvoj praktických dovedností.
Klíčová slova: MS Excel; popisná statistika; Statgraphics; analýza dat; veřejně dostupné datové soubory; výuka statistických předmětů; analýza rozptylu; kontingenční tabulky; regresní analýzy; statistické metody
Název práce: The Use of Publicly Available Data Sets in Statistical Analysis
Autor(ka) práce: Janečková, Monika
Typ práce: Bachelor thesis
Vedoucí práce: Danko, Jakub
Oponenti práce: Löster, Tomáš
Jazyk práce: Česky
Abstrakt:
The continuously growing number of publicly available data sources represents a significant advantage when selecting datasets suitable for the demonstration of statistical analyses. This bachelor’s thesis focuses on the use of publicly available datasets in the teaching of statistics courses. The main goal of the thesis is to identify and categorize datasets that are appropriate for demonstrating specific statistical methods. The theoretical part of the thesis describes publicly available data sources and statistical methods, including statistical hypotheses, assumptions, and mathematical relationships. The practical part focuses on the application of selected statistical analyses – analysis of variance, contingency tables and regression analysis. These analyses are performed using a combination of statistical softwares, specifically MS Excel and Statgraphics. The results are complemented by interpretations of the outputs. Finally, recommendations are made for the use of datasets that are suitable for demonstrating the mentioned statistical methods. This is a valuable contribution for students as well as educators looking for datasets that support the development of practical skills.
Klíčová slova: statistical methods; regression analysis; teaching of statistics; contingency tables; descriptive statistics; data analysis; publicly available datasets; analysis of variance; MS Excel; Statgraphics

Informace o studiu

Studijní program / obor: Matematické metody v ekonomii/Datové analýzy a modelování
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 4. 2. 2025
Datum podání práce: 12. 5. 2025
Datum obhajoby: 2025

Soubory ke stažení

Soubory budou k dispozici až po obhajobě práce.

    Poslední aktualizace: