Published May 10, 2024 | Version v1
Publication Open

A Deep Neural Network for Road Extraction with the Capability to Remove Foreign Objects with Similar Spectra

  • 1. East China University of Technology
  • 2. Ministry of Natural Resources

Description

Abstract. Existing road extraction methods based on deep learning often struggle with distinguishing ground objects that share similar spectral information, such as roads and buildings. Consequently, this study proposes a dual encoder-decoder deep neural network to address road extraction in complex backgrounds. In the feature extraction stage, the first encoder-decoder designed for extracting road features. The second encoder-decoder utilized for extracting building features. During the feature fusion stage, road features and building features are integrated using a subtraction method. The resultant road features, constrained by building features, enhance the preservation of accurate road feature information. Within the feature fusion stage, road feature maps and building feature maps designated for fusion are input into the convolutional block attention module. This step aims to amplify the features of different channels and extract key information from diverse spatial positions. Subsequently, feature fusion is executed using the element-by-element subtraction method. The outcome is road features constrained by building features, thus preserving more precise road feature information. Experimental results demonstrate that the model successfully learns both road and building features concurrently. It effectively distinguishes between easily confused roads and buildings with similar spectral information, ultimately enhancing the accuracy of road extraction.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

الملخص. غالبًا ما تواجه طرق استخراج الطرق الحالية القائمة على التعلم العميق صعوبة في تمييز الأجسام الأرضية التي تشترك في معلومات طيفية مماثلة، مثل الطرق والمباني. وبالتالي، تقترح هذه الدراسة شبكة عصبية عميقة ثنائية التشفير وفك التشفير لمعالجة استخراج الطرق في الخلفيات المعقدة. في مرحلة استخراج الميزات، تم تصميم أول وحدة فك تشفير لاستخراج ميزات الطريق. جهاز فك التشفير الثاني المستخدم لاستخراج ميزات المبنى. خلال مرحلة دمج الميزات، يتم دمج ميزات الطريق وميزات المبنى باستخدام طريقة الطرح. تعزز ميزات الطريق الناتجة، المقيدة بميزات المبنى، الحفاظ على معلومات دقيقة عن ميزات الطريق. ضمن مرحلة دمج الميزات، يتم إدخال خرائط ميزات الطرق وخرائط ميزات المباني المخصصة للاندماج في وحدة انتباه الكتلة الالتفافية. تهدف هذه الخطوة إلى تضخيم ميزات القنوات المختلفة واستخراج المعلومات الرئيسية من المواقع المكانية المتنوعة. بعد ذلك، يتم تنفيذ دمج الميزات باستخدام طريقة الطرح لكل عنصر على حدة. والنتيجة هي ميزات الطريق المقيدة بميزات المبنى، وبالتالي الحفاظ على معلومات أكثر دقة عن ميزات الطريق. تُظهر النتائج التجريبية أن النموذج يتعلم بنجاح كل من ميزات الطرق والمباني في وقت واحد. إنه يميز بشكل فعال بين الطرق والمباني التي يسهل الخلط بينها بمعلومات طيفية مماثلة، مما يعزز في النهاية دقة استخراج الطرق.

Translated Description (French)

Résumé. Les méthodes d'extraction de routes existantes basées sur l'apprentissage en profondeur ont souvent du mal à distinguer les objets au sol qui partagent des informations spectrales similaires, telles que les routes et les bâtiments. Par conséquent, cette étude propose un réseau neuronal profond à double encodeur-décodeur pour traiter l'extraction de routes dans des contextes complexes. Dans l'étape d'extraction des caractéristiques, le premier codeur-décodeur conçu pour extraire les caractéristiques de la route. Le deuxième codeur-décodeur utilisé pour extraire les caractéristiques du bâtiment. Au cours de l'étape de fusion des caractéristiques, les caractéristiques routières et les caractéristiques du bâtiment sont intégrées à l'aide d'une méthode de soustraction. Les caractéristiques routières résultantes, limitées par les caractéristiques du bâtiment, améliorent la préservation d'informations précises sur les caractéristiques routières. Dans l'étape de fusion des caractéristiques, les cartes des caractéristiques de la route et les cartes des caractéristiques du bâtiment désignées pour la fusion sont entrées dans le module d'attention du bloc convolutionnel. Cette étape vise à amplifier les caractéristiques des différents canaux et à extraire des informations clés de diverses positions spatiales. Par la suite, la fusion de caractéristiques est exécutée à l'aide de la méthode de soustraction élément par élément. Le résultat est que les caractéristiques de la route sont limitées par les caractéristiques du bâtiment, préservant ainsi des informations plus précises sur les caractéristiques de la route. Les résultats expérimentaux démontrent que le modèle apprend avec succès les caractéristiques de la route et du bâtiment simultanément. Il fait effectivement la distinction entre les routes et les bâtiments facilement confus avec des informations spectrales similaires, améliorant finalement la précision de l'extraction des routes.

Translated Description (Spanish)

Resumen. Los métodos de extracción de carreteras existentes basados en el aprendizaje profundo a menudo tienen dificultades para distinguir objetos terrestres que comparten información espectral similar, como carreteras y edificios. En consecuencia, este estudio propone una red neuronal profunda de codificador-decodificador dual para abordar la extracción de carreteras en entornos complejos. En la etapa de extracción de características, el primer codificador-decodificador diseñado para extraer características de la carretera. El segundo codificador-decodificador utilizado para extraer características del edificio. Durante la etapa de fusión de características, las características de la carretera y las características del edificio se integran utilizando un método de resta. Las características de la carretera resultantes, limitadas por las características del edificio, mejoran la preservación de la información precisa de las características de la carretera. Dentro de la etapa de fusión de características, los mapas de características de carreteras y los mapas de características de edificios designados para la fusión se introducen en el módulo de atención de bloques convolucionales. Este paso tiene como objetivo amplificar las características de los diferentes canales y extraer información clave de diversas posiciones espaciales. Posteriormente, la fusión de características se ejecuta utilizando el método de resta elemento por elemento. El resultado son características de la carretera limitadas por las características del edificio, preservando así una información más precisa de las características de la carretera. Los resultados experimentales demuestran que el modelo aprende con éxito las características de la carretera y del edificio al mismo tiempo. Distingue de manera efectiva entre carreteras y edificios fácilmente confundibles con información espectral similar, lo que en última instancia mejora la precisión de la extracción de carreteras.

Files

isprs-archives-XLVIII-1-2024-193-2024.pdf.pdf

Files (1.7 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:15a9e408d0a188cb2602fd1596bf2a17
1.7 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
شبكة عصبية عميقة لاستخراج الطرق مع القدرة على إزالة الأجسام الغريبة ذات الأطياف المماثلة
Translated title (French)
Un réseau neuronal profond pour l'extraction routière avec la capacité d'éliminer les corps étrangers avec des spectres similaires
Translated title (Spanish)
Una red neuronal profunda para la extracción de carreteras con la capacidad de eliminar objetos extraños con espectros similares

Identifiers

Other
https://openalex.org/W4396829374
DOI
10.5194/isprs-archives-xlviii-1-2024-193-2024

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China