Are raw satellite bands and machine learning all you need to retrieve actual evapotranspiration?
Creators
- 1. Cadi Ayyad University
- 2. Université Ibn Zohr
- 3. Université Mohammed VI Polytechnique
Description
Accurately estimating latent heat flux (LE) is crucial for achieving efficiency in irrigation. It is a fundamental component in determining the actual evapotranspiration (ETa), which in turn, quantifies the amount of water lost that needs to be adequately compensated through irrigation. Empirical and physics-based models have extensive input data and site-specific limitations when estimating the LE. In contrast, the emergence of data-driven techniques combined with remote sensing has shown promising results for LE estimation with minimal and easy-to-obtain input data. This paper evaluates two machine learning-based approaches for estimating the LE. The first uses climate data, the Normalized Difference Vegetation Index (NDVI), and Land Surface Temperature (LST), while the second uses climate data combined with raw satellite bands. In-situ data were sourced from a flux station installed in our study area. The data include air temperatures (T a ), global solar radiation (R g ), and measured LE for the period 2015-2018. The study uses Landsat 8 as a remote sensing data source. At first, 12 raw available bands were downloaded. The LST is then derived from thermal bands using the Split Window algorithm (SW) and the NDVI from optical bands. During machine learning modeling, the CatBoost model is fed, trained, and evaluated using the two data combination approaches. Cross-validation of 3-folds gave an average RMSE of 27.54 W.nr 2 using the first approach and 27.05 W.nr 2 using the second approach. Results raise the question: Do we need additional computational layers when working with remote sensing products combined with machine learning? Future work is to generalize the approach and test it for other applications such as soil moisture retrieval, and yield prediction.
Translated Descriptions
Translated Description (Arabic)
يعد التقدير الدقيق للتدفق الحراري الكامن (LE) أمرًا بالغ الأهمية لتحقيق الكفاءة في الري. وهو عنصر أساسي في تحديد التبخر والنتح الفعلي (ETA)، والذي بدوره يحدد كمية المياه المفقودة التي تحتاج إلى تعويض مناسب من خلال الري. تحتوي النماذج التجريبية والقائمة على الفيزياء على بيانات مدخلات واسعة وقيود خاصة بالموقع عند تقدير LE. في المقابل، أظهر ظهور التقنيات القائمة على البيانات جنبًا إلى جنب مع الاستشعار عن بعد نتائج واعدة لتقدير LE مع الحد الأدنى من بيانات الإدخال وسهولة الحصول عليها. تقيّم هذه الورقة نهجين قائمين على التعلم الآلي لتقدير LE. يستخدم الأول البيانات المناخية، ومؤشر الفرق الطبيعي للغطاء النباتي (NDVI)، ودرجة حرارة سطح الأرض (LST)، بينما يستخدم الثاني البيانات المناخية جنبًا إلى جنب مع نطاقات الأقمار الصناعية الخام. تم الحصول على البيانات في الموقع من محطة تدفق مثبتة في منطقة دراستنا. وتشمل البيانات درجات حرارة الهواء (T a )، والإشعاع الشمسي العالمي (R g )، وقياس LE للفترة 2015-2018. تستخدم الدراسة لاندسات 8 كمصدر لبيانات الاستشعار عن بعد. في البداية، تم تنزيل 12 نطاقًا متاحًا خامًا. ثم يتم اشتقاق LST من النطاقات الحرارية باستخدام خوارزمية النافذة المقسمة (SW) و NDVI من النطاقات البصرية. أثناء نمذجة التعلم الآلي، يتم تغذية نموذج CatBoost وتدريبه وتقييمه باستخدام نهجي تجميع البيانات. أعطى التحقق المتبادل من 3 أضعاف متوسط RMSE يبلغ 27.54 W.nr 2 باستخدام النهج الأول و 27.05 W.nr 2 باستخدام النهج الثاني. تثير النتائج السؤال التالي: هل نحتاج إلى طبقات حسابية إضافية عند العمل مع منتجات الاستشعار عن بعد جنبًا إلى جنب مع التعلم الآلي ؟ العمل المستقبلي هو تعميم النهج واختباره لتطبيقات أخرى مثل استرجاع رطوبة التربة، والتنبؤ بالعائد.Translated Description (French)
L'estimation précise du flux de chaleur latente (LE) est cruciale pour atteindre l'efficacité de l'irrigation. C'est un élément fondamental dans la détermination de l'évapotranspiration réelle (ETa), qui à son tour, quantifie la quantité d'eau perdue qui doit être compensée de manière adéquate par l'irrigation. Les modèles empiriques et basés sur la physique ont des données d'entrée étendues et des limites spécifiques au site lors de l'estimation de l'EL. En revanche, l'émergence de techniques basées sur les données combinées à la télédétection a montré des résultats prometteurs pour l'estimation du LE avec des données d'entrée minimales et faciles à obtenir. Cet article évalue deux approches basées sur l'apprentissage automatique pour estimer le LE. Le premier utilise des données climatiques, l'indice de végétation à différence normalisée (NDVI) et la température de surface du sol (LST), tandis que le second utilise des données climatiques combinées à des bandes satellitaires brutes. Les données in situ proviennent d'une station de flux installée dans notre zone d'étude. Les données comprennent les températures de l'air (T a ), le rayonnement solaire global (R g ) et le LE mesuré pour la période 2015-2018. L'étude utilise Landsat 8 comme source de données de télédétection. Au début, 12 bandes brutes disponibles ont été téléchargées. Le LST est ensuite dérivé des bandes thermiques à l'aide de l'algorithme Split Window (SW) et le NDVI des bandes optiques. Au cours de la modélisation par apprentissage automatique, le modèle CatBoost est alimenté, formé et évalué à l'aide des deux approches de combinaison de données. La validation croisée de 3 fois a donné un RMSE moyen de 27,54 W.nr 2 en utilisant la première approche et de 27,05 W.nr 2 en utilisant la seconde approche. Les résultats soulèvent la question suivante : avons-nous besoin de couches de calcul supplémentaires lorsque nous travaillons avec des produits de télédétection combinés à l'apprentissage automatique ? Les travaux futurs consistent à généraliser l'approche et à la tester pour d'autres applications telles que la récupération de l'humidité du sol et la prédiction du rendement.Translated Description (Spanish)
Estimar con precisión el flujo de calor latente (LE) es crucial para lograr la eficiencia en el riego. Es un componente fundamental en la determinación de la evapotranspiración real (ETa), que a su vez, cuantifica la cantidad de agua perdida que necesita ser compensada adecuadamente a través del riego. Los modelos empíricos y basados en la física tienen amplios datos de entrada y limitaciones específicas del sitio al estimar el LE. Por el contrario, la aparición de técnicas basadas en datos combinadas con la teledetección ha mostrado resultados prometedores para la estimación de LE con datos de entrada mínimos y fáciles de obtener. Este documento evalúa dos enfoques basados en el aprendizaje automático para estimar el LE. El primero utiliza datos climáticos, el Índice de Vegetación de Diferencia Normalizada (NDVI) y la Temperatura de la Superficie Terrestre (LST), mientras que el segundo utiliza datos climáticos combinados con bandas satelitales sin procesar. Los datos in situ se obtuvieron de una estación de flujo instalada en nuestra área de estudio. Los datos incluyen las temperaturas del aire (T a), la radiación solar global (R g ) y el LE medido para el período 2015-2018. El estudio utiliza Landsat 8 como fuente de datos de teledetección. Al principio, se descargaron 12 bandas disponibles sin procesar. El LST se deriva de las bandas térmicas utilizando el algoritmo de ventana dividida (SW) y el NDVI de las bandas ópticas. Durante el modelado de aprendizaje automático, el modelo CatBoost se alimenta, entrena y evalúa utilizando los dos enfoques de combinación de datos. La validación cruzada de 3 veces dio un RMSE promedio de 27.54 W.nr 2 usando el primer enfoque y 27.05 W.nr 2 usando el segundo enfoque. Los resultados plantean la pregunta: ¿Necesitamos capas computacionales adicionales cuando trabajamos con productos de teledetección combinados con aprendizaje automático? El trabajo futuro es generalizar el enfoque y probarlo para otras aplicaciones, como la recuperación de la humedad del suelo y la predicción del rendimiento.Files
e3sconf_gire3d2024_04019.pdf.pdf
Files
(24 Bytes)
| Name | Size | Download all |
|---|---|---|
|
md5:7624dcbc096921e31a1da610e19a546e
|
24 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- هل نطاقات الأقمار الصناعية الخام والتعلم الآلي هي كل ما تحتاجه لاسترداد التبخر والنتح الفعلي ؟
- Translated title (French)
- Les bandes satellites brutes et l'apprentissage automatique sont-ils tout ce dont vous avez besoin pour récupérer l'évapotranspiration réelle ?
- Translated title (Spanish)
- ¿Las bandas satelitales RAW y el aprendizaje automático son todo lo que necesita para recuperar la evapotranspiración real?
Identifiers
- Other
- https://openalex.org/W4391695874
- DOI
- 10.1051/e3sconf/202448904019
References
- https://openalex.org/W1986450870
- https://openalex.org/W2011195592
- https://openalex.org/W2016237711
- https://openalex.org/W2031802061
- https://openalex.org/W2067542652
- https://openalex.org/W2100696276
- https://openalex.org/W2114059122
- https://openalex.org/W2163606831
- https://openalex.org/W2744657337
- https://openalex.org/W2940609395
- https://openalex.org/W3012575662
- https://openalex.org/W3088761308
- https://openalex.org/W3164065489
- https://openalex.org/W3199526518
- https://openalex.org/W3199689813
- https://openalex.org/W3203914580
- https://openalex.org/W3205690427
- https://openalex.org/W4210750239
- https://openalex.org/W4367693024
- https://openalex.org/W4386577320