Published December 23, 2022 | Version v1
Publication Open

Wheat yield estimation using remote sensing data based on machine learning approaches

  • 1. Aerospace Information Research Institute
  • 2. Chinese Academy of Sciences
  • 3. University of Chinese Academy of Sciences
  • 4. Beijing Institute of Big Data Research
  • 5. Tsinghua University
  • 6. China Centre for Resources Satellite Data and Application
  • 7. Ministry of Natural Resources
  • 8. National Engineering Research Center for Information Technology in Agriculture
  • 9. Huawei Technologies (China)
  • 10. Ministry of Agriculture and Rural Affairs

Description

Accurate predictions of wheat yields are essential to farmers'production plans and to the international trade in wheat. However, only poor approximations of the productivity of wheat crops in China can be obtained using traditional linear regression models based on vegetation indices and observations of the yield. In this study, Sentinel-2 (multispectral data) and ZY-1 02D (hyperspectral data) were used together with 15709 gridded yield data (with a resolution of 5 m × 5 m) to predict the winter wheat yield. These estimates were based on four mainstream data-driven approaches: Long Short-Term Memory (LSTM), Random Forest (RF), Gradient Boosting Decision Tree (GBDT), and Support Vector Regression (SVR). The method that gave the best estimate of the winter wheat yield was determined, and the accuracy of the estimates based on multispectral and hyperspectral data were compared. The results showed that the LSTM model, for which the RMSE of the estimates was 0.201 t/ha, performed better than the RF (RMSE = 0.260 t/ha), GBDT (RMSE = 0.306 t/ha), and SVR (RMSE = 0.489 t/ha) methods. The estimates based on the ZY-1 02D hyperspectral data were more accurate than those based on the 30-m Sentinel-2 data: RMSE = 0.237 t/ha for the ZY-1 02D data, which is about a 5% improvement on the RSME of 0.307 t/ha for the 30-m Sentinel-2 data. However, the 10-m Sentinel-2 data performed even better, giving an RMSE of 0.219 t/ha. In addition, it was found that the greenness vegetation index SR (simple ratio index) outperformed the traditional vegetation indices. The results highlight the potential of the shortwave infrared bands to replace the visible and near-infrared bands for predicting crop yields Our study demonstrates the advantages of the deep learning method LSTM over machine learning methods in terms of its ability to make accurate estimates of the winter wheat yield.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تعد التنبؤات الدقيقة لمحاصيل القمح ضرورية لخطط إنتاج المزارعين وللتجارة الدولية في القمح. ومع ذلك، لا يمكن الحصول إلا على تقديرات تقريبية ضعيفة لإنتاجية محاصيل القمح في الصين باستخدام نماذج الانحدار الخطي التقليدية القائمة على مؤشرات الغطاء النباتي وملاحظات المحصول. في هذه الدراسة، تم استخدام Sentinel -2 (البيانات متعددة الأطياف) و ZY -1 02d (البيانات فائقة الطيفية) جنبًا إلى جنب مع 15709 بيانات المحصول الشبكي (بدقة 5 م × 5 م) للتنبؤ بمحصول القمح الشتوي. استندت هذه التقديرات إلى أربعة مناهج رئيسية قائمة على البيانات: الذاكرة طويلة الأجل (LSTM)، والغابات العشوائية (RF)، وشجرة قرارات تعزيز التدرج (GBDT)، وانحدار ناقلات الدعم (SVR). تم تحديد الطريقة التي أعطت أفضل تقدير لمحصول القمح الشتوي، وتمت مقارنة دقة التقديرات القائمة على بيانات متعددة الأطياف وفائقة الطيف. أظهرت النتائج أن نموذج LSTM، الذي كان فيه RMSE للتقديرات 0.201 طن/هكتار، كان أداؤه أفضل من RF (RMSE = 0.260 طن/هكتار)، GBDT (RMSE = 0.306 طن/هكتار)، و SVR (RMSE = 0.489 طن/هكتار). كانت التقديرات المستندة إلى بيانات الطيف الفائق ZY -1 02d أكثر دقة من تلك المستندة إلى بيانات Sentinel -2 التي يبلغ طولها 30 مترًا: RMSE = 0.237 طن/هكتار لبيانات ZY -1 02D، وهو ما يمثل تحسنًا بنسبة 5 ٪ تقريبًا على RSME البالغ 0.307 طن/هكتار لبيانات Sentinel -2 التي يبلغ طولها 30 مترًا. ومع ذلك، كان أداء بيانات Sentinel -2 التي يبلغ طولها 10 أمتار أفضل، مما أعطى RMSE 0.219 طن/هكتار. بالإضافة إلى ذلك، وجد أن مؤشر الخضرة للغطاء النباتي SR (مؤشر النسبة البسيط) تفوق على مؤشرات الغطاء النباتي التقليدية. تسلط النتائج الضوء على إمكانات نطاقات الأشعة تحت الحمراء للموجات القصيرة لتحل محل النطاقات المرئية والقريبة من الأشعة تحت الحمراء للتنبؤ بغلة المحاصيل. توضح دراستنا مزايا طريقة التعلم العميق LSTM على طرق التعلم الآلي من حيث قدرتها على إجراء تقديرات دقيقة لمحصول القمح الشتوي.

Translated Description (French)

Des prévisions précises des rendements du blé sont essentielles aux plans de production des agriculteurs et au commerce international du blé. Cependant, seules de faibles approximations de la productivité des cultures de blé en Chine peuvent être obtenues à l'aide de modèles de régression linéaire traditionnels basés sur des indices de végétation et des observations du rendement. Dans cette étude, Sentinel-2 (données multispectrales) et ZY-1 02D (données hyperspectrales) ont été utilisés avec 15709 données de rendement maillées (avec une résolution de 5 m × 5 m) pour prédire le rendement du blé d'hiver. Ces estimations étaient basées sur quatre approches principales basées sur les données : la mémoire à long terme (LSTM), la forêt aléatoire (RF), l'arbre décisionnel d'augmentation du gradient (GBDT) et la régression vectorielle de soutien (SVR). La méthode qui donnait la meilleure estimation du rendement du blé d'hiver a été déterminée, et l'exactitude des estimations basées sur des données multispectrales et hyperspectrales a été comparée. Les résultats ont montré que le modèle LSTM, pour lequel le RMSE des estimations était de 0,201 t/ha, était plus performant que les méthodes RF (RMSE = 0,260 t/ha), GBDT (RMSE = 0,306 t/ha) et SVR (RMSE = 0,489 t/ha). Les estimations basées sur les données hyperspectrales ZY-1 02D étaient plus précises que celles basées sur les données Sentinel-2 de 30 m : RMSE = 0,237 t/ha pour les données ZY-1 02D, ce qui représente une amélioration d'environ 5% du RSME de 0,307 t/ha pour les données Sentinel-2 de 30 m. Cependant, les données Sentinel-2 de 10 m ont été encore meilleures, donnant un RMSE de 0,219 t/ha. De plus, il a été constaté que l'indice de végétation de verdure SR (indice de ratio simple) surpassait les indices de végétation traditionnels. Les résultats mettent en évidence le potentiel des bandes infrarouges à ondes courtes pour remplacer les bandes visibles et proches infrarouges pour prédire les rendements des cultures. Notre étude démontre les avantages de la méthode d'apprentissage profond LSTM par rapport aux méthodes d'apprentissage automatique en termes de capacité à faire des estimations précises du rendement du blé d'hiver.

Translated Description (Spanish)

Las predicciones precisas de los rendimientos del trigo son esenciales para los planes de producción de los agricultores y para el comercio internacional de trigo. Sin embargo, solo se pueden obtener aproximaciones pobres de la productividad de los cultivos de trigo en China utilizando modelos tradicionales de regresión lineal basados en índices de vegetación y observaciones del rendimiento. En este estudio, se utilizaron Sentinel-2 (datos multiespectrales) y ZY-1 02D (datos hiperespectrales) junto con datos de rendimiento en cuadrícula 15709 (con una resolución de 5 m × 5 m) para predecir el rendimiento del trigo de invierno. Estas estimaciones se basaron en cuatro enfoques principales basados en datos: memoria a largo plazo (LSTM), bosque aleatorio (RF), árbol de decisiones de impulso de gradiente (GBDT) y regresión vectorial de soporte (SVR). Se determinó el método que dio la mejor estimación del rendimiento del trigo de invierno y se comparó la precisión de las estimaciones basadas en datos multiespectrales e hiperespectrales. Los resultados mostraron que el modelo LSTM, para el cual el RMSE de las estimaciones fue de 0.201 t/ha, tuvo un mejor desempeño que los métodos RF (RMSE = 0.260 t/ha), GBDT (RMSE = 0.306 t/ha) y SVR (RMSE = 0.489 t/ha). Las estimaciones basadas en los datos hiperespectrales de ZY-1 02D fueron más precisas que las basadas en los datos de Sentinel-2 de 30 m: RMSE = 0.237 t/ha para los datos de ZY-1 02D, que es aproximadamente una mejora del 5% en la RSME de 0.307 t/ha para los datos de Sentinel-2 de 30 m. Sin embargo, los datos de Sentinel-2 de 10 m tuvieron un rendimiento aún mejor, dando un RMSE de 0,219 t/ha. Además, se encontró que el índice de vegetación de verdor SR (simple ratio index) superó a los índices de vegetación tradicionales. Los resultados resaltan el potencial de las bandas infrarrojas de onda corta para reemplazar las bandas visibles e infrarrojas cercanas para predecir los rendimientos de los cultivos. Nuestro estudio demuestra las ventajas del método de aprendizaje profundo LSTM sobre los métodos de aprendizaje automático en términos de su capacidad para hacer estimaciones precisas del rendimiento del trigo de invierno.

Files

pdf.pdf

Files (14.6 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:6e6287b8edbfc1de107b1383d488dcb1
14.6 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
تقدير محصول القمح باستخدام بيانات الاستشعار عن بعد بناءً على مناهج التعلم الآلي
Translated title (French)
Estimation du rendement du blé à l'aide de données de télédétection basées sur des approches d'apprentissage automatique
Translated title (Spanish)
Estimación del rendimiento de trigo utilizando datos de teledetección basados en enfoques de aprendizaje automático

Identifiers

Other
https://openalex.org/W4312176112
DOI
10.3389/fpls.2022.1090970

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W1492720951
  • https://openalex.org/W1972324718
  • https://openalex.org/W1978617972
  • https://openalex.org/W1987097445
  • https://openalex.org/W2003299437
  • https://openalex.org/W2041371820
  • https://openalex.org/W2064675550
  • https://openalex.org/W2089441588
  • https://openalex.org/W2113410727
  • https://openalex.org/W2126034361
  • https://openalex.org/W2166004064
  • https://openalex.org/W2318242042
  • https://openalex.org/W2324783874
  • https://openalex.org/W2370256590
  • https://openalex.org/W2580808806
  • https://openalex.org/W2604645045
  • https://openalex.org/W2762524281
  • https://openalex.org/W2911287026
  • https://openalex.org/W2911964244
  • https://openalex.org/W2919115771
  • https://openalex.org/W2944794516
  • https://openalex.org/W2962862931
  • https://openalex.org/W2969476445
  • https://openalex.org/W2979842301
  • https://openalex.org/W2983376237
  • https://openalex.org/W2989100060
  • https://openalex.org/W2991751858
  • https://openalex.org/W2995678734
  • https://openalex.org/W2996041315
  • https://openalex.org/W2997552745
  • https://openalex.org/W3008924261
  • https://openalex.org/W3029014910
  • https://openalex.org/W3046887616
  • https://openalex.org/W3049446945
  • https://openalex.org/W3081407997
  • https://openalex.org/W3095120300
  • https://openalex.org/W3111174758
  • https://openalex.org/W3134139262
  • https://openalex.org/W3150095517
  • https://openalex.org/W3164809178
  • https://openalex.org/W3185030868
  • https://openalex.org/W3198376164
  • https://openalex.org/W3205788253
  • https://openalex.org/W3209765799
  • https://openalex.org/W3209906348
  • https://openalex.org/W3211300303
  • https://openalex.org/W3211679552
  • https://openalex.org/W4205508379
  • https://openalex.org/W4210692941
  • https://openalex.org/W4212798049
  • https://openalex.org/W4220683592
  • https://openalex.org/W4281651044
  • https://openalex.org/W4285202307
  • https://openalex.org/W4293385584
  • https://openalex.org/W4301785137
  • https://openalex.org/W4306385517
  • https://openalex.org/W4307548948