Development of Machine Learning Model for Intent Recognition from ATC Radio Communication

Thesis title: Tvorba modelu strojového učení pro rozpoznání záměru z rádiové komunikace ATC
Author: Marhan, Michal
Thesis type: Diplomová práce
Supervisor: Mittner, Jan
Opponents: Vencovský, Filip
Thesis language: Česky
Abstract:
Tato diplomová práce se zaměřuje na vývoj modelu strojového učení pro převod řeči na text specificky upravený pro českou leteckou komunikaci, který dosahuje vyšší přesnosti než obecné modely. Výsledky ukazují, že navržený model strojového učení pomocí trénování modelu Whisper Large v3 od OpenAI dosahuje mnohem nižší slovní chybovosti (WER 9 %). Vzhledem k chybějícím volně dostupným datasetům pro učení práce dále obsahuje návrh a realizaci rozsáhlé architektury pro automatický sběr, ukládání a zpracování rádiové komunikace v zóně letového provozu na českých letištích. Práce poskytuje detailní popis hardwarové části architektury pro spolehlivý příjem letecké komunikace s minimální úrovní šumu. Softwarová část popisuje a implementuje škálovatelnou architekturu pro nasazení zařízení internetu věcí s možností vzdálené správy napříč českými letišti včetně backendové části pro sběr a zpracování velkého množství leteckých nahrávek. Následně práce navrhuje ověření konceptu pro automatickou extrakci důležitých informací, jako jsou volací značky, letové dráhy a záměr pilota, z přepsané nahrávky pomocí velkých jazykových modelů. Během celého projektu práce využívá metodiky MMSP pro vývoj softwarové části projektu a CRISP-DM zaměřeným na porozumění, modelování a zpracování dat.
Keywords: sdr; pytorch; docker; letecké pásmo; velké jazykové modely; gpt; řeč na text; whisper; hugging face; letištní provozní zóna; letecká komunikace; strojové učení; internet věcí; azure speech; softwarově definované rádio
Thesis title: Development of Machine Learning Model for Intent Recognition from ATC Radio Communication
Author: Marhan, Michal
Thesis type: Diploma thesis
Supervisor: Mittner, Jan
Opponents: Vencovský, Filip
Thesis language: Česky
Abstract:
Thesis focuses on the development of a machine learning model for converting speech to text, specifically tailored for Czech aviation communication, achieving higher accuracy than general models. The results show that the designed machine learning model, using OpenAI's Whisper Large v3 training model, achieves much lower word error rate (WER 9%). Given the lack of freely available datasets for training, the thesis also includes the design and implementation of an extensive architecture for automatic collection, storage, and processing of radio communication in the aerodrome traffic zone at Czech airports. The work contains a detailed description of the hardware part of the architecture for reliable reception of aviation communication with minimal noise level. The software part describes and implements a scalable architecture for deploying Internet of Things devices with remote management capabilities across Czech airports, including the backend for collecting and processing a large volume of aviation recordings. Subsequently, the thesis proposes a concept verification for automatic extraction of important information such as call signs, flight paths, and pilot intentions from the transcribed recordings using large language models. For the entire project, the thesis utilizes MMSP methodology for developing the software part of the project and CRISP-DM focused on understanding, modeling, and processing data.
Keywords: hugging face; atc; machine learning; internet of things; air traffic communication; azure speech; speech to text; whisper; sdr; software defined radio; pytorch; docker; airband; atz; large language models

Information about study

Study programme: Informační systémy a technologie/Vývoj informačních systémů
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 12. 12. 2022
Date of submission: 29. 4. 2024
Date of defense: 29. 5. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/83108/podrobnosti

Files for download

    Last update: