Tvorba modelu strojového učení pro rozpoznání záměru z rádiové komunikace ATC

Název práce: Tvorba modelu strojového učení pro rozpoznání záměru z rádiové komunikace ATC
Autor(ka) práce: Marhan, Michal
Typ práce: Diplomová práce
Vedoucí práce: Mittner, Jan
Oponenti práce: Vencovský, Filip
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zaměřuje na vývoj modelu strojového učení pro převod řeči na text specificky upravený pro českou leteckou komunikaci, který dosahuje vyšší přesnosti než obecné modely. Výsledky ukazují, že navržený model strojového učení pomocí trénování modelu Whisper Large v3 od OpenAI dosahuje mnohem nižší slovní chybovosti (WER 9 %). Vzhledem k chybějícím volně dostupným datasetům pro učení práce dále obsahuje návrh a realizaci rozsáhlé architektury pro automatický sběr, ukládání a zpracování rádiové komunikace v zóně letového provozu na českých letištích. Práce poskytuje detailní popis hardwarové části architektury pro spolehlivý příjem letecké komunikace s minimální úrovní šumu. Softwarová část popisuje a implementuje škálovatelnou architekturu pro nasazení zařízení internetu věcí s možností vzdálené správy napříč českými letišti včetně backendové části pro sběr a zpracování velkého množství leteckých nahrávek. Následně práce navrhuje ověření konceptu pro automatickou extrakci důležitých informací, jako jsou volací značky, letové dráhy a záměr pilota, z přepsané nahrávky pomocí velkých jazykových modelů. Během celého projektu práce využívá metodiky MMSP pro vývoj softwarové části projektu a CRISP-DM zaměřeným na porozumění, modelování a zpracování dat.
Klíčová slova: sdr; pytorch; docker; letecké pásmo; velké jazykové modely; gpt; řeč na text; whisper; hugging face; letištní provozní zóna; letecká komunikace; strojové učení; internet věcí; azure speech; softwarově definované rádio
Název práce: Development of Machine Learning Model for Intent Recognition from ATC Radio Communication
Autor(ka) práce: Marhan, Michal
Typ práce: Diploma thesis
Vedoucí práce: Mittner, Jan
Oponenti práce: Vencovský, Filip
Jazyk práce: Česky
Abstrakt:
Thesis focuses on the development of a machine learning model for converting speech to text, specifically tailored for Czech aviation communication, achieving higher accuracy than general models. The results show that the designed machine learning model, using OpenAI's Whisper Large v3 training model, achieves much lower word error rate (WER 9%). Given the lack of freely available datasets for training, the thesis also includes the design and implementation of an extensive architecture for automatic collection, storage, and processing of radio communication in the aerodrome traffic zone at Czech airports. The work contains a detailed description of the hardware part of the architecture for reliable reception of aviation communication with minimal noise level. The software part describes and implements a scalable architecture for deploying Internet of Things devices with remote management capabilities across Czech airports, including the backend for collecting and processing a large volume of aviation recordings. Subsequently, the thesis proposes a concept verification for automatic extraction of important information such as call signs, flight paths, and pilot intentions from the transcribed recordings using large language models. For the entire project, the thesis utilizes MMSP methodology for developing the software part of the project and CRISP-DM focused on understanding, modeling, and processing data.
Klíčová slova: hugging face; atc; machine learning; internet of things; air traffic communication; azure speech; speech to text; whisper; sdr; software defined radio; pytorch; docker; airband; atz; large language models

Informace o studiu

Studijní program / obor: Informační systémy a technologie/Vývoj informačních systémů
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 12. 12. 2022
Datum podání práce: 29. 4. 2024
Datum obhajoby: 29. 5. 2024
Identifikátor v systému InSIS: https://insis.vse.cz/zp/83108/podrobnosti

Soubory ke stažení

    Poslední aktualizace: