An ensemble deep learning models approach using image analysis for cotton crop classification in AI-enabled smart agriculture
Creators
- 1. National University of Computer and Emerging Sciences
- 2. Mehran University of Engineering and Technology
- 3. King Abdulaziz University
- 4. Fraunhofer Institute for Open Communication Systems
Description
Abstract Background Agriculture is one of the most crucial assets of any country, as it brings prosperity by alleviating poverty, food shortages, unemployment, and economic instability. The entire process of agriculture comprises many sectors, such as crop cultivation, water irrigation, the supply chain, and many more. During the cultivation process, the plant is exposed to many challenges, among which pesticide attacks and disease in the plant are the main threats. Diseases affect yield production, which affects the country's economy. Over the past decade, there have been significant advancements in agriculture; nevertheless, a substantial portion of crop yields continues to be compromised by diseases and pests. Early detection and prevention are crucial for successful crop management. Methods To address this, we propose a framework that utilizes state-of-the-art computer vision (CV) and artificial intelligence (AI) techniques, specifically deep learning (DL), for detecting healthy and unhealthy cotton plants. Our approach combines DL with feature extraction methods such as continuous wavelet transform (CWT) and fast Fourier transform (FFT). The detection process involved employing pre-trained models such as AlexNet, GoogLeNet, InceptionV3, and VGG-19. Implemented models performance was analysed based on metrics such as accuracy, precision, recall, F1-Score, and Confusion matrices. Moreover, the proposed framework employed ensemble learning framework which uses averaging method to fuse the classification score of individual DL model, thereby improving the overall classification accuracy. Results During the training process, the framework achieved better performance when features extracted from CWT were used as inputs to the DL model compared to features extracted from FFT. Among the learning models, GoogleNet obtained a remarkable accuracy of 93.4% and a notable F1-score of 0.953 when trained on features extracted by CWT in comparison to FFT-extracted features. It was closely followed by AlexNet and InceptionV3 with an accuracy of 93.4% and 91.8% respectively. To further improve the classification accuracy, ensemble learning framework achieved 98.4% on the features extracted from CWT as compared to feature extracted from FFT. Conclusion The results show that the features extracted as scalograms more accurately detect each plant condition using DL models, facilitating the early detection of diseases in cotton plants. This early detection leads to better yield and profit which positively affects the economy.
Translated Descriptions
Translated Description (Arabic)
تعتبر الزراعة واحدة من أهم الأصول في أي بلد، لأنها تجلب الرخاء من خلال التخفيف من حدة الفقر ونقص الغذاء والبطالة وعدم الاستقرار الاقتصادي. تشمل عملية الزراعة بأكملها العديد من القطاعات، مثل زراعة المحاصيل وري المياه وسلسلة التوريد وغيرها الكثير. أثناء عملية الزراعة، يتعرض النبات للعديد من التحديات، من بينها هجمات المبيدات الحشرية والأمراض في النبات هي التهديدات الرئيسية. تؤثر الأمراض على إنتاج الغلة، مما يؤثر على اقتصاد البلاد. على مدى العقد الماضي، كان هناك تقدم كبير في الزراعة ؛ ومع ذلك، لا يزال جزء كبير من غلات المحاصيل يتعرض للخطر بسبب الأمراض والآفات. يعد الكشف المبكر والوقاية أمرًا بالغ الأهمية لإدارة المحاصيل بنجاح. لمعالجة هذا، نقترح إطارًا يستخدم أحدث تقنيات الرؤية الحاسوبية (CV) والذكاء الاصطناعي (AI)، وتحديدًا التعلم العميق (DL)، للكشف عن نباتات القطن الصحية وغير الصحية. يجمع نهجنا بين DL وطرق استخراج الميزات مثل التحويل الموجي المستمر (CWT) وتحويل فورييه السريع (FFT). تضمنت عملية الكشف استخدام نماذج مدربة مسبقًا مثل AlexNet و GoogLeNet و InceptionV3 و VGG -19. تم تحليل أداء النماذج المنفذة بناءً على مقاييس مثل الدقة والتذكر ونقاط الفورمولا 1 ومصفوفات الارتباك. علاوة على ذلك، استخدم الإطار المقترح إطار التعلم الجماعي الذي يستخدم طريقة المتوسط لدمج درجة تصنيف نموذج التعلم الرقمي الفردي، وبالتالي تحسين دقة التصنيف الإجمالية. النتائج خلال عملية التدريب، حقق الإطار أداءً أفضل عندما تم استخدام الميزات المستخرجة من CWT كمدخلات لنموذج DL مقارنة بالميزات المستخرجة من FFT. من بين نماذج التعلم، حصلت GoogleNet على دقة ملحوظة بلغت 93.4 ٪ ودرجة F1 ملحوظة بلغت 0.953 عند التدريب على الميزات المستخرجة من CWT مقارنة بالميزات المستخرجة من FFT. تبعها عن كثب AlexNet و InceptionV3 بدقة 93.4 ٪ و 91.8 ٪ على التوالي. لزيادة تحسين دقة التصنيف، حقق إطار التعلم الجماعي 98.4 ٪ على الميزات المستخرجة من CWT مقارنة بالميزة المستخرجة من FFT. الخاتمة تُظهر النتائج أن الميزات المستخرجة كمخططات تدريجية تكشف بدقة أكبر عن كل حالة نباتية باستخدام نماذج DL، مما يسهل الكشف المبكر عن الأمراض في نباتات القطن. يؤدي هذا الكشف المبكر إلى عائد وربح أفضل مما يؤثر بشكل إيجابي على الاقتصاد.Translated Description (French)
Résumé Contexte L'agriculture est l'un des atouts les plus cruciaux de tout pays, car elle apporte la prospérité en atténuant la pauvreté, les pénuries alimentaires, le chômage et l'instabilité économique. L'ensemble du processus agricole comprend de nombreux secteurs, tels que la culture, l'irrigation de l'eau, la chaîne d'approvisionnement et bien d'autres. Au cours du processus de culture, la plante est exposée à de nombreux défis, parmi lesquels les attaques de pesticides et les maladies de la plante sont les principales menaces. Les maladies affectent la production de rendement, ce qui affecte l'économie du pays. Au cours de la dernière décennie, il y a eu des progrès significatifs dans l'agriculture ; néanmoins, une partie substantielle des rendements des cultures continue d'être compromise par les maladies et les ravageurs. La détection et la prévention précoces sont cruciales pour une gestion réussie des cultures. Méthodes Pour y remédier, nous proposons un cadre qui utilise des techniques de vision par ordinateur (CV) et d'intelligence artificielle (IA) de pointe, en particulier l'apprentissage en profondeur (DL), pour détecter les plants de coton sains et malsains. Notre approche combine DL avec des méthodes d'extraction de caractéristiques telles que la transformée en ondelettes continue (CWT) et la transformée de Fourier rapide (FFT). Le processus de détection impliquait l'utilisation de modèles pré-entraînés tels qu'AlexNet, GoogLeNet, InceptionV3 et VGG-19. Les performances des modèles mis en œuvre ont été analysées en fonction de paramètres tels que l'exactitude, la précision, le rappel, le score F1 et les matrices de confusion. De plus, le cadre proposé utilisait un cadre d'apprentissage d'ensemble qui utilise une méthode de moyennage pour fusionner le score de classification du modèle DL individuel, améliorant ainsi la précision globale de la classification. Résultats Au cours du processus de formation, le cadre a obtenu de meilleures performances lorsque les caractéristiques extraites de CWT ont été utilisées comme entrées du modèle DL par rapport aux caractéristiques extraites de FFT. Parmi les modèles d'apprentissage, GoogleNet a obtenu une précision remarquable de 93,4 % et un score F1 notable de 0,953 lorsqu'il est formé sur les fonctionnalités extraites par CWT par rapport aux fonctionnalités extraites par FFT. Il a été suivi de près par AlexNet et InceptionV3 avec une précision de 93,4 % et 91,8 % respectivement. Pour améliorer encore la précision de la classification, le cadre d'apprentissage d'ensemble a atteint 98,4 % sur les fonctionnalités extraites de CWT par rapport aux fonctionnalités extraites de FFT. Conclusion Les résultats montrent que les caractéristiques extraites sous forme de scalogrammes détectent plus précisément chaque état de la plante à l'aide de modèles DL, facilitant la détection précoce des maladies chez les plants de coton. Cette détection précoce conduit à de meilleurs rendements et profits, ce qui a un impact positif sur l'économie.Translated Description (Spanish)
Antecedentes La agricultura es uno de los activos más cruciales de cualquier país, ya que trae prosperidad al aliviar la pobreza, la escasez de alimentos, el desempleo y la inestabilidad económica. Todo el proceso de la agricultura comprende muchos sectores, como el cultivo de cultivos, el riego con agua, la cadena de suministro y muchos más. Durante el proceso de cultivo, la planta está expuesta a muchos desafíos, entre los cuales los ataques de pesticidas y las enfermedades en la planta son las principales amenazas. Las enfermedades afectan la producción de rendimiento, lo que afecta la economía del país. Durante la última década, ha habido avances significativos en la agricultura; sin embargo, una parte sustancial de los rendimientos de los cultivos sigue estando comprometida por enfermedades y plagas. La detección temprana y la prevención son cruciales para una gestión exitosa de los cultivos. Para abordar esto, proponemos un marco que utiliza técnicas de visión artificial (CV) e inteligencia artificial (IA) de última generación, específicamente el aprendizaje profundo (DL), para detectar plantas de algodón sanas y no sanas. Nuestro enfoque combina DL con métodos de extracción de características como la transformada wavelet continua (CWT) y la transformada rápida de Fourier (FFT). El proceso de detección implicó el empleo de modelos pre-entrenados como AlexNet, GoogLeNet, InceptionV3 y VGG-19. El rendimiento de los modelos implementados se analizó en función de métricas como la exactitud, la precisión, la recuperación, la puntuación F1 y las matrices de confusión. Además, el marco propuesto empleó un marco de aprendizaje conjunto que utiliza un método de promediado para fusionar la puntuación de clasificación del modelo DL individual, mejorando así la precisión general de la clasificación. Resultados Durante el proceso de capacitación, el marco logró un mejor rendimiento cuando las características extraídas de CWT se utilizaron como insumos para el modelo DL en comparación con las características extraídas de FFT. Entre los modelos de aprendizaje, GoogleNet obtuvo una precisión notable del 93,4% y una puntuación F1 notable de 0,953 cuando se entrenó en características extraídas por CWT en comparación con las características extraídas por FFT. Le siguieron de cerca AlexNet e InceptionV3 con una precisión del 93,4% y el 91,8%, respectivamente. Para mejorar aún más la precisión de la clasificación, el marco de aprendizaje conjunto logró un 98.4% en las características extraídas de CWT en comparación con la característica extraída de FFT. Conclusión Los resultados muestran que las características extraídas como escalogramas detectan con mayor precisión cada condición de la planta utilizando modelos DL, lo que facilita la detección temprana de enfermedades en las plantas de algodón. Esta detección temprana conduce a un mejor rendimiento y beneficio que afecta positivamente a la economía.Additional details
Additional titles
- Translated title (Arabic)
- نهج نماذج التعلم العميق الجماعي باستخدام تحليل الصور لتصنيف محاصيل القطن في الزراعة الذكية المدعومة بالذكاء الاصطناعي
- Translated title (French)
- Une approche de modèles d'apprentissage en profondeur d'ensemble utilisant l'analyse d'image pour la classification des cultures de coton dans l'agriculture intelligente basée sur l'IA
- Translated title (Spanish)
- Un enfoque de modelos de aprendizaje profundo en conjunto que utiliza el análisis de imágenes para la clasificación de cultivos de algodón en agricultura inteligente habilitada por IA
Identifiers
- Other
- https://openalex.org/W4400623776
- DOI
- 10.1186/s13007-024-01228-w
References
- https://openalex.org/W1677182931
- https://openalex.org/W1978331315
- https://openalex.org/W2019191944
- https://openalex.org/W2019949559
- https://openalex.org/W2031423206
- https://openalex.org/W2041636156
- https://openalex.org/W2091205549
- https://openalex.org/W2097117768
- https://openalex.org/W2110073318
- https://openalex.org/W2163810466
- https://openalex.org/W2183341477
- https://openalex.org/W2194775991
- https://openalex.org/W2470368200
- https://openalex.org/W2473156356
- https://openalex.org/W2618530766
- https://openalex.org/W2731165298
- https://openalex.org/W2754228943
- https://openalex.org/W2801958709
- https://openalex.org/W2807820559
- https://openalex.org/W2809602495
- https://openalex.org/W2891667148
- https://openalex.org/W2892167904
- https://openalex.org/W2902061692
- https://openalex.org/W2908112616
- https://openalex.org/W2911433502
- https://openalex.org/W2915519176
- https://openalex.org/W2919115771
- https://openalex.org/W2930650313
- https://openalex.org/W2940118123
- https://openalex.org/W2947799441
- https://openalex.org/W2949749214
- https://openalex.org/W2963446712
- https://openalex.org/W2970602317
- https://openalex.org/W2988842639
- https://openalex.org/W3003067960
- https://openalex.org/W3015562698
- https://openalex.org/W3023740432
- https://openalex.org/W3033864984
- https://openalex.org/W3044699854
- https://openalex.org/W3048871475
- https://openalex.org/W3092075612
- https://openalex.org/W3155966371
- https://openalex.org/W3158827491
- https://openalex.org/W3159001133
- https://openalex.org/W3165587188
- https://openalex.org/W3180998648
- https://openalex.org/W3185377372
- https://openalex.org/W3196717993
- https://openalex.org/W3215845028
- https://openalex.org/W4205920687
- https://openalex.org/W4221007826
- https://openalex.org/W4281849375
- https://openalex.org/W4293770138
- https://openalex.org/W4294730803
- https://openalex.org/W4327693079
- https://openalex.org/W4386863279
- https://openalex.org/W4388419449