Obsahová analýza technologických blogů
Název práce: | Obsahová analýza technologických blogů |
---|---|
Autor(ka) práce: | Irišek, Michael |
Typ práce: | Diplomová práce |
Vedoucí práce: | Vencovský, Filip |
Oponenti práce: | Bruckner, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | Tato diplomová práce se zabývá obsahovou analýzou technologických blogů a analyzuje možnost jejího využití k predikci budoucího vývoje na poli technologických novinek. Pro provedení analýzy byla nejprve sestavena rešerše odborných zdrojů, na jejímž základě byl sestaven návrh následujícího postupu výzkumu. Postup zahrnuje získání dat pomocí web crawlingové Python knihovny Scrapy, následné zpracování dat v open-source platformě KNIME a aplikace Latentní Dirichletovy analýzy. Výsledky jsou dále interpretovány pomocí kontingenčních tabulek a grafů. Součástí práce je také další diskuze interpretovaných výsledků obsahující zhodnocení využitých postupů a případné způsoby rozšíření výzkumu. Autor v práci dochází k závěru, že vytvořená metodika dokáže správně analyzovat data z vybraných blogů a odhalovat jejich nejčastější témata. Po interpretaci nalezených témat bylo zjištěno, že na jejich základě není možné podle vytvořené metodiky vytvářet důvěryhodné predikce. Metodika však dokáže popisovat momentální situaci ve sledovaném období. Poznatky z práce zmíněné v diskuzi mohou sloužit k dalšímu výzkumu na obdobné téma, popřípadě mohou být adaptovány pro jiné využití, jelikož samotná automatická obsahová analýza témat z technologických blogů fungovala bezproblémově. |
Klíčová slova: | obsahová analýza; těžení dat; LDA; Scrapy |
Název práce: | Content Analysis of Technology Blogs |
---|---|
Autor(ka) práce: | Irišek, Michael |
Typ práce: | Diploma thesis |
Vedoucí práce: | Vencovský, Filip |
Oponenti práce: | Bruckner, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | The main focus of this master’s thesis is content analysis of technology blogs. It analyses the possible usage of content analysis to predict future development of examined technology fields. To conduct this analysis, author firstly created a literary review of academic sources, which was later used to develop a further method of research. The method consists of mining necessary data via web crawling Python library Scrapy, processing aforementioned data in open-source platform KNIME and application of Latent Dirichlet analysis. The results are further interpreted using pivot tables and graphs. A discussion of interpreted results is a key part of the thesis as well and it is used to evaluate applied method and to identify possible ways of extending the conducted research. Author concludes that the created method can correctly analyse data from selected blogs and can detect the correct topics from said data. After further interpretation of results, it was discovered, that the created method cannot be used to reliably predict future developments. On the other hand, it is fully capable of describing the current situation in examined time period. All the findings mentioned in the thesis’ discussion chapter could be used in further research dealing with similar topics, or could be adapted in a different context, because the created method for automated content analysis of technology blogs was deemed to be working successfully. |
Klíčová slova: | content analysis; data mining; LDA; Scrapy |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 1. 2. 2019 |
---|---|
Datum podání práce: | 27. 11. 2019 |
Datum obhajoby: | 23. 1. 2020 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/70812/podrobnosti |