Published October 30, 2023 | Version v1
Publication Open

An improved beluga whale optimizer—Derived Adaptive multi-channel DeepLabv3+ for semantic segmentation of aerial images

  • 1. Vellore Institute of Technology University

Description

Semantic segmentation process over Remote Sensing images has been regarded as hot research work. Even though the Remote Sensing images provide many essential features, the sampled images are inconsistent in size. Even if a similar network can segment Remote Sensing images to some extents, segmentation accuracy needs to be improved. General neural networks are used to improve categorization accuracy, but they also caused significant losses to target scale and spatial features, and the traditional common features fusion techniques can only resolve some of the issues. A segmentation network has been designed to resolve the above-mentioned issues as well. With the motive of addressing the difficulties in the existing semantic segmentation techniques for aerial images, the adoption of deep learning techniques is utilized. This model has adopted a new Adaptive Multichannel Deeplabv3+ (AMC-Deeplabv3+) with the help of a new meta-heuristic algorithm called Improved Beluga whale optimization (IBWO). Here, the hyperparameters of Multichannel deeplabv3+ are optimized by the IBWO algorithm. The proposed model significantly enhances the performance of the overall system by measuring the accuracy and dice coefficient. The proposed model attains improved accuracies of 98.65% & 98.72% for dataset 1 and 2 respectively and also achieves the dice coefficient of 98.73% & 98.85% respectively with a computation time of 113.0123 seconds. The evolutional outcomes of the proposed model show significantly better than the state of the art techniques like CNN, MUnet and DFCNN models.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

وقد اعتبرت عملية التجزئة الدلالية على صور الاستشعار عن بعد عملاً بحثياً ساخناً. على الرغم من أن صور الاستشعار عن بعد توفر العديد من الميزات الأساسية، إلا أن الصور التي تم أخذ عينات منها غير متناسقة في الحجم. حتى إذا تمكنت شبكة مماثلة من تقسيم صور الاستشعار عن بعد إلى بعض النطاقات، فيجب تحسين دقة التجزئة. تُستخدم الشبكات العصبية العامة لتحسين دقة التصنيف، ولكنها تسببت أيضًا في خسائر كبيرة في النطاق المستهدف والسمات المكانية، ولا يمكن لتقنيات دمج السمات الشائعة التقليدية سوى حل بعض المشكلات. تم تصميم شبكة تجزئة لحل المشكلات المذكورة أعلاه أيضًا. وبدافع معالجة الصعوبات في تقنيات التجزئة الدلالية الحالية للصور الجوية، يتم استخدام اعتماد تقنيات التعلم العميق. اعتمد هذا النموذج Deeplabv3 + متعدد القنوات التكيفي الجديد (AMC - Deeplabv3 +) بمساعدة خوارزمية استدلالية جديدة تسمى تحسين حوت البيلوجا المحسن (IBWO). هنا، يتم تحسين المعلمات الفائقة لـ deeplabv3+ متعدد القنوات من خلال خوارزمية IBWO. يعزز النموذج المقترح بشكل كبير أداء النظام العام من خلال قياس الدقة ومعامل النرد. يحقق النموذج المقترح دقة محسنة بنسبة 98.65 ٪ و 98.72 ٪ لمجموعة البيانات 1 و 2 على التوالي ويحقق أيضًا معامل النرد بنسبة 98.73 ٪ و 98.85 ٪ على التوالي مع وقت حساب قدره 113.0123 ثانية. تظهر النتائج التطورية للنموذج المقترح أفضل بكثير من أحدث التقنيات مثل نماذج CNN و MUnet و DFCNN.

Translated Description (French)

Le processus de segmentation sémantique sur les images de télédétection a été considéré comme un travail de recherche à chaud. Même si les images de télédétection fournissent de nombreuses fonctionnalités essentielles, la taille des images échantillonnées est incohérente. Même si un réseau similaire peut segmenter les images de télédétection dans une certaine mesure, la précision de la segmentation doit être améliorée. Les réseaux de neurones généraux sont utilisés pour améliorer la précision de la catégorisation, mais ils ont également causé des pertes importantes à l'échelle de la cible et aux caractéristiques spatiales, et les techniques traditionnelles de fusion des caractéristiques communes ne peuvent résoudre que certains des problèmes. Un réseau de segmentation a également été conçu pour résoudre les problèmes susmentionnés. Dans le but de résoudre les difficultés des techniques de segmentation sémantique existantes pour les images aériennes, l'adoption de techniques d'apprentissage en profondeur est utilisée. Ce modèle a adopté un nouveau Deeplabv3 + multicanal adaptatif (AMC-Deeplabv3+) à l'aide d'un nouvel algorithme méta-heuristique appelé Optimisation améliorée du béluga (IBWO). Ici, les hyperparamètres de Multichannel deeplabv3+ sont optimisés par l'algorithme IBWO. Le modèle proposé améliore considérablement les performances de l'ensemble du système en mesurant la précision et le coefficient de dés. Le modèle proposé atteint des précisions améliorées de 98,65 % et 98,72 % pour les ensembles de données 1 et 2 respectivement et atteint également le coefficient de dés de 98,73 % et 98,85 % respectivement avec un temps de calcul de 113,0123 secondes. Les résultats évolutifs du modèle proposé montrent nettement mieux que les techniques de pointe telles que les modèles CNN, MUnet et DFCNN.

Translated Description (Spanish)

El proceso de segmentación semántica sobre imágenes de teledetección se ha considerado un trabajo de investigación en caliente. A pesar de que las imágenes de teledetección proporcionan muchas características esenciales, las imágenes muestreadas son inconsistentes en tamaño. Incluso si una red similar puede segmentar las imágenes de teledetección en cierta medida, es necesario mejorar la precisión de la segmentación. Las redes neuronales generales se utilizan para mejorar la precisión de la categorización, pero también causaron pérdidas significativas en la escala objetivo y las características espaciales, y las técnicas tradicionales de fusión de características comunes solo pueden resolver algunos de los problemas. También se ha diseñado una red de segmentación para resolver los problemas mencionados anteriormente. Con el fin de abordar las dificultades en las técnicas de segmentación semántica existentes para imágenes aéreas, se utiliza la adopción de técnicas de aprendizaje profundo. Este modelo ha adoptado un nuevo Adaptive Multichannel Deeplabv3+ (AMC-Deeplabv3+) con la ayuda de un nuevo algoritmo metaheurístico llamado Improved Beluga whale optimization (IBWO). Aquí, los hiperparámetros de multicanal deeplabv3+ están optimizados por el algoritmo IBWO. El modelo propuesto mejora significativamente el rendimiento del sistema general al medir la precisión y el coeficiente de dados. El modelo propuesto alcanza precisiones mejoradas de 98.65% y 98.72% para el conjunto de datos 1 y 2 respectivamente y también logra el coeficiente dice de 98.73% y 98.85% respectivamente con un tiempo de cálculo de 113.0123 segundos. Los resultados evolutivos del modelo propuesto muestran ser significativamente mejores que las técnicas de vanguardia como los modelos CNN, MUnet y DFCNN.

Files

journal.pone.0290624&type=printable.pdf

Files (2.6 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:31231ab0c6a0c19ff307884524380f81
2.6 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
محسن حوت بيلوجا محسن مشتق من DeepLabv3+ متعدد القنوات للتجزئة الدلالية للصور الجوية
Translated title (French)
Un optimiseur de béluga amélioré - DeepLabv3 + multicanal adaptatif dérivé pour la segmentation sémantique des images aériennes
Translated title (Spanish)
Optimizador de ballenas beluga mejorado: DeepLabv3 + multicanal adaptativo derivado para la segmentación semántica de imágenes aéreas

Identifiers

Other
https://openalex.org/W4388019000
DOI
10.1371/journal.pone.0290624

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
India

References

  • https://openalex.org/W1966597175
  • https://openalex.org/W1967090357
  • https://openalex.org/W2814568980
  • https://openalex.org/W2967731069
  • https://openalex.org/W2970628322
  • https://openalex.org/W2972540077
  • https://openalex.org/W3006764547
  • https://openalex.org/W3009525954
  • https://openalex.org/W3018169007
  • https://openalex.org/W3042926514
  • https://openalex.org/W3047753558
  • https://openalex.org/W3130788620
  • https://openalex.org/W3136421595
  • https://openalex.org/W3141920857
  • https://openalex.org/W3148302677
  • https://openalex.org/W3159442990
  • https://openalex.org/W3185857823
  • https://openalex.org/W3197922842
  • https://openalex.org/W3217288639
  • https://openalex.org/W4200292895
  • https://openalex.org/W4206241865
  • https://openalex.org/W4206356281
  • https://openalex.org/W4207077357
  • https://openalex.org/W4220738217
  • https://openalex.org/W4220747070
  • https://openalex.org/W4281687867
  • https://openalex.org/W4285234694
  • https://openalex.org/W4293309901
  • https://openalex.org/W4308499151
  • https://openalex.org/W4312057093
  • https://openalex.org/W4313420829
  • https://openalex.org/W4313531078
  • https://openalex.org/W4317556935
  • https://openalex.org/W4323925704