Předpověď výnosu pšenice pomocí regresního přístupu
Název práce: | Wheat yield prediction using a regression approach |
---|---|
Autor(ka) práce: | Kuzdas, Vojtěch |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Štěpánek, Lubomír |
Oponenti práce: | Pinkas, Jaroslav |
Jazyk práce: | English |
Abstrakt: | This bachelor thesis explores the applicability of linear and tree regression models in predicting the true yield of wheat crops in the South Moravian and Ústí nad Labem regions in the Czech Republic. Thesis pairs Sentinel-2 satellite imagery with single-season post-harvest yield data into a 10x10m grid. Yield data are split into percentile and manually filtered datasets. Two vegetation indices, NDVI and EVI, are extracted from satellite imagery and used as the primary independent variables in model training. Some models use additional post-harvest variables as independent variables. Simple and multiple linear regression and tree regression with bagging are done to predict the true yield. All models across all datasets are compared using standard R2 and MSE statistics. Models based on heavily filtered datasets achieve R2 values in the upper range of 0.92. Models based on less filtered datasets achieve R2 values of 0.65. However, the industrial applicability of constructed models requires further discussion due to potential issues (e.g. overfitting). Tree-based models showed better performance over linear regression models. Although perceived promisingly, tree-bagging did not prove to be effective on the given data. |
Klíčová slova: | Yield Prediction; Remote Sensing; Precision Agriculture; Linear Regression; Regression Trees; Bagging |
Název práce: | Předpověď výnosu pšenice pomocí regresního přístupu |
---|---|
Autor(ka) práce: | Kuzdas, Vojtěch |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Štěpánek, Lubomír |
Oponenti práce: | Pinkas, Jaroslav |
Jazyk práce: | English |
Abstrakt: | Tato bakalářská práce zkoumá použitelnost lineárních a stromových regresních modelů při predikci skutečného výnosu pšenice v Jihomoravském a Ústeckém kraji v České republice. Práce páruje družicové snímky Sentinel-2 s daty o výnosu po sklizni v jedné sezóně do mřížky 10x10m. Data o výnosech jsou rozdělena na percentilové a manuálně filtrované soubory dat. Ze satelitních snímků jsou extrahovány dva vegetační indexy, NDVI a EVI, které jsou použity jako primární nezávislé proměnné při trénování modelu. Některé modely používají jako nezávislé proměnné další proměnné po sklizni. K předpovědi skutečného výnosu se provádí jednoduchá a vícenásobná lineární regrese a stromová regrese s baggingem. Všechny modely ve všech souborech dat jsou porovnány pomocí standardních statistik R^2 Modely založené na silně filtrovaných souborech dat dosahují hodnot R^2 v horním rozmezí 0,92. Modely založené na méně filtrovaných souborech dat dosahují hodnot R^2 0,65. Průmyslová použitelnost zkonstruovaných modelů však vyžaduje další diskusi vzhledem k možným problémům (např. nadměrný fitting). Modely založené na stromech vykazovaly lepší výkonnost než lineární regresní modely. Ačkoli byly vnímány slibně, stromové modely se na daných datech neukázaly jako efektivní. |
Klíčová slova: | Předpověď výnosů; Dálkový průzkum Země; Precizní zemědělství; Lineární regrese; Regresní stromy; Bagging |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 3. 2. 2022 |
---|---|
Datum podání práce: | 8. 5. 2022 |
Datum obhajoby: | 24. 6. 2022 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/79596/podrobnosti |