Advanced data analysis using GPT-4 code interpreter

Thesis title: Pokročilá analýza dat s využitím GPT-4 code interpreter
Author: Marchenko, Pavlo
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Luc, Ladislav
Thesis language: Česky
Tato bakalářská práce se zaměřuje na využití GPT-4, velkého jazykového modelu vyvinutého společností OpenAI, pro účely pokročilé datové analýzy. Práce zkoumá, jak lze tento model efektivně používat za účelem řešení různých analytických úkolů a jaké výhody a omezení to přináší ve srovnání s tradičními metodami. Praktická část práce obsahuje aplikaci ChatGPT-4 na konkrétní datové sady, kde jsou modely testovány na různých úlohách, od generování textu po komplexní analýzu dat. Výsledky práce ukazují, že ChatGPT-4 může značně zefektivnit procesy datové analýzy, automatizovat určité činnosti prováděné datovými analytiky a usnadnit interpretaci komplexních datových souborů. Práce také identifikuje potenciální implementační a technologické výzvy spojené s využíváním AI v analýze dat, které jsou klíčové pro bezpečné a efektivní využití AI technologií v analýze dat.
Keywords: GPT-4; pokročilá datová analýza; umělá inteligence; zpětnovazební učení; jazykové modely; interpretace dat; strojové učení; NLP
This bachelor thesis focuses on the use of GPT-4, an advanced language model developed by OpenAI, for advanced data analysis purposes. The work examines how this model can be effectively implemented into various analytical tasks and what advantages and limitations this brings compared to traditional methods. The practical part of the thesis includes the application of ChatGPT-4 to specific datasets, where the models are tested on various tasks, from text generation to complex data analysis. The results show that ChatGPT-4 can significantly streamline data analysis processes, automate certain activities performed by data analysts, and facilitate the interpretation of complex data files. The work also identifies potential implementation and technological challenges associated with using AI in data analysis, which are crucial for the safe and effective use of AI technologies in data analysis.
Keywords: machine learning; reinforcement learning; language models; data interpretation; NLP; GPT-4; advanced data analysis; artificial intelligence

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 6. 11. 2023
Date of submission: 6. 5. 2024
Date of defense: 17. 6. 2024
Identifier in the InSIS system:

