Obsahová analýza technologických blogů

Název práce: Obsahová analýza technologických blogů
Autor(ka) práce: Irišek, Michael
Typ práce: Diplomová práce
Vedoucí práce: Vencovský, Filip
Oponenti práce: Bruckner, Tomáš
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá obsahovou analýzou technologických blogů a analyzuje možnost jejího využití k predikci budoucího vývoje na poli technologických novinek. Pro provedení analýzy byla nejprve sestavena rešerše odborných zdrojů, na jejímž základě byl sestaven návrh následujícího postupu výzkumu. Postup zahrnuje získání dat pomocí web crawlingové Python knihovny Scrapy, následné zpracování dat v open-source platformě KNIME a aplikace Latentní Dirichletovy analýzy. Výsledky jsou dále interpretovány pomocí kontingenčních tabulek a grafů. Součástí práce je také další diskuze interpretovaných výsledků obsahující zhodnocení využitých postupů a případné způsoby rozšíření výzkumu. Autor v práci dochází k závěru, že vytvořená metodika dokáže správně analyzovat data z vybraných blogů a odhalovat jejich nejčastější témata. Po interpretaci nalezených témat bylo zjištěno, že na jejich základě není možné podle vytvořené metodiky vytvářet důvěryhodné predikce. Metodika však dokáže popisovat momentální situaci ve sledovaném období. Poznatky z práce zmíněné v diskuzi mohou sloužit k dalšímu výzkumu na obdobné téma, popřípadě mohou být adaptovány pro jiné využití, jelikož samotná automatická obsahová analýza témat z technologických blogů fungovala bezproblémově.
Klíčová slova: obsahová analýza; těžení dat; LDA; Scrapy
Název práce: Content Analysis of Technology Blogs
Autor(ka) práce: Irišek, Michael
Typ práce: Diploma thesis
Vedoucí práce: Vencovský, Filip
Oponenti práce: Bruckner, Tomáš
Jazyk práce: Česky
Abstrakt:
The main focus of this master’s thesis is content analysis of technology blogs. It analyses the possible usage of content analysis to predict future development of examined technology fields. To conduct this analysis, author firstly created a literary review of academic sources, which was later used to develop a further method of research. The method consists of mining necessary data via web crawling Python library Scrapy, processing aforementioned data in open-source platform KNIME and application of Latent Dirichlet analysis. The results are further interpreted using pivot tables and graphs. A discussion of interpreted results is a key part of the thesis as well and it is used to evaluate applied method and to identify possible ways of extending the conducted research. Author concludes that the created method can correctly analyse data from selected blogs and can detect the correct topics from said data. After further interpretation of results, it was discovered, that the created method cannot be used to reliably predict future developments. On the other hand, it is fully capable of describing the current situation in examined time period. All the findings mentioned in the thesis’ discussion chapter could be used in further research dealing with similar topics, or could be adapted in a different context, because the created method for automated content analysis of technology blogs was deemed to be working successfully.
Klíčová slova: content analysis; data mining; LDA; Scrapy

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 1. 2. 2019
Datum podání práce: 27. 11. 2019
Datum obhajoby: 23. 1. 2020
Identifikátor v systému InSIS: https://insis.vse.cz/zp/70812/podrobnosti

Soubory ke stažení

    Poslední aktualizace: