Published November 26, 2019 | Version v1
Publication Open

Indoor versus outdoor scene recognition for navigation of a micro aerial vehicle using spatial color gist wavelet descriptors

  • 1. Indian Institute of Technology Madras
  • 2. Anna University, Chennai

Description

Abstract In the context of improved navigation for micro aerial vehicles, a new scene recognition visual descriptor, called spatial color gist wavelet descriptor (SCGWD), is proposed. SCGWD was developed by combining proposed Ohta color-GIST wavelet descriptors with census transform histogram (CENTRIST) spatial pyramid representation descriptors for categorizing indoor versus outdoor scenes. A binary and multiclass support vector machine (SVM) classifier with linear and non-linear kernels was used to classify indoor versus outdoor scenes and indoor scenes, respectively. In this paper, we have also discussed the feature extraction methodology of several, state-of-the-art visual descriptors, and four proposed visual descriptors (Ohta color-GIST descriptors, Ohta color-GIST wavelet descriptors, enhanced Ohta color histogram descriptors, and SCGWDs), in terms of experimental perspectives. The proposed enhanced Ohta color histogram descriptors, Ohta color-GIST descriptors, Ohta color-GIST wavelet descriptors, SCGWD, and state-of-the-art visual descriptors were evaluated, using the Indian Institute of Technology Madras Scene Classification Image Database two, an Indoor-Outdoor Dataset, and the Massachusetts Institute of Technology indoor scene classification dataset [(MIT)-67]. Experimental results showed that the indoor versus outdoor scene recognition algorithm, employing SVM with SCGWDs, produced the highest classification rates (CRs)—95.48% and 99.82% using radial basis function kernel (RBF) kernel and 95.29% and 99.45% using linear kernel for the IITM SCID2 and Indoor-Outdoor datasets, respectively. The lowest CRs—2.08% and 4.92%, respectively—were obtained when RBF and linear kernels were used with the MIT-67 dataset. In addition, higher CRs, precision, recall, and area under the receiver operating characteristic curve values were obtained for the proposed SCGWDs, in comparison with state-of-the-art visual descriptors.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

الخلاصة في سياق الملاحة المحسنة للمركبات الجوية الصغيرة، يُقترح وصف مرئي جديد للتعرف على المشهد، يسمى واصف الموجات الموجية الملونة المكانية (SCGWD). تم تطوير SCGWD من خلال الجمع بين أوصاف موجات Ohta color - GIST المقترحة مع أوصاف التمثيل الهرمي المكاني لتحويل التعداد (المركزي) لتصنيف المشاهد الداخلية مقابل المشاهد الخارجية. تم استخدام مصنف متجه دعم ثنائي ومتعدد الطبقات (SVM) مع حبات خطية وغير خطية لتصنيف المشاهد الداخلية مقابل المشاهد الخارجية والمشاهد الداخلية، على التوالي. في هذه الورقة، ناقشنا أيضًا منهجية استخراج الميزات للعديد من الأوصاف المرئية الحديثة، وأربعة أوصاف مرئية مقترحة (أوتا أوصاف GIST بالألوان، أوتا أوصاف موجات GIST بالألوان، أوتا أوصاف الرسم البياني بالألوان المحسنة، و SCGWDs)، من حيث وجهات النظر التجريبية. تم تقييم أوصاف أوتا المحسنة للمخطط البياني للألوان، وواصفات أوتا للألوان- GIST، وواصفات أوتا للألوان- GIST الموجية، و SCGWD، وواصفات بصرية حديثة، باستخدام قاعدة بيانات صور تصنيف مشهد مدراس التابعة للمعهد الهندي للتكنولوجيا 2، ومجموعة بيانات داخلية وخارجية، ومجموعة بيانات تصنيف مشهد داخلي لمعهد ماساتشوستس للتكنولوجيا [(MIT)-67]. أظهرت النتائج التجريبية أن خوارزمية التعرف على المشهد الداخلي مقابل الخارجي، التي تستخدم SVM مع SCGWDs، أنتجت أعلى معدلات التصنيف (CRs) -95.48 ٪ و 99.82 ٪ باستخدام نواة دالة الأساس الشعاعي (RBF) و 95.29 ٪ و 99.45 ٪ باستخدام نواة خطية لمجموعات بيانات IITM SCID2 و Indoor - Outdoor، على التوالي. تم الحصول على أدنى نسبة CRs-2.08 ٪ و 4.92 ٪ على التوالي عند استخدام RBF والنوى الخطية مع مجموعة بيانات MIT -67. بالإضافة إلى ذلك، تم الحصول على قيم منحنى تشغيل أعلى CRs، ودقة، واستدعاء، ومنطقة تحت قيم منحنى تشغيل جهاز الاستقبال لـ SCGWDs المقترحة، مقارنة بأحدث الأوصاف المرئية.

Translated Description (French)

Résumé Dans le contexte d'une navigation améliorée pour les micro-véhicules aériens, un nouveau descripteur visuel de reconnaissance de scène, appelé descripteur d'ondelettes GIST de couleur spatiale (SCGWD), est proposé. SCGWD a été développé en combinant les descripteurs d'ondelettes Ohta color-GIST proposés avec les descripteurs de représentation pyramidale spatiale de l'histogramme de transformation de recensement (CENTRISTE) pour catégoriser les scènes intérieures par rapport aux scènes extérieures. Un classificateur de machine vectorielle de support (SVM) binaire et multiclasse avec des noyaux linéaires et non linéaires a été utilisé pour classer les scènes intérieures par rapport aux scènes extérieures et aux scènes intérieures, respectivement. Dans cet article, nous avons également discuté de la méthodologie d'extraction de caractéristiques de plusieurs descripteurs visuels de pointe et de quatre descripteurs visuels proposés (descripteurs couleur Ohta-GIST, descripteurs ondelettes couleur Ohta-GIST, descripteurs d'histogramme couleur Ohta améliorés et SCGWD), en termes de perspectives expérimentales. Les descripteurs d'histogramme de couleur Ohta améliorés proposés, les descripteurs couleur Ohta-GIST, les descripteurs d'ondelettes couleur Ohta-GIST, les SCGWD et les descripteurs visuels de pointe ont été évalués à l'aide de la deuxième base de données d'images de classification de scène de l'Indian Institute of Technology Madras, d'un ensemble de données intérieur-extérieur et de l'ensemble de données de classification de scène intérieure du Massachusetts Institute of Technology [(mit)-67]. Les résultats expérimentaux ont montré que l'algorithme de reconnaissance de la scène intérieure par rapport à la scène extérieure, utilisant des SVM avec des SCGWD, produisait les taux de classification (CR) les plus élevés -95,48% et 99,82% en utilisant le noyau de la fonction de base radiale (RBF) et 95,29% et 99,45% en utilisant le noyau linéaire pour les ensembles de données IITM SCID2 et Indoor-Outdoor, respectivement. Les CR les plus faibles - 2,08 % et 4,92 %, respectivement - ont été obtenus lorsque le RBF et les noyaux linéaires ont été utilisés avec l'ensemble de données MIT-67. En outre, des CR, une précision, un rappel et une aire sous les valeurs de la courbe caractéristique de fonctionnement du récepteur plus élevés ont été obtenus pour les SCGWD proposés, par rapport aux descripteurs visuels de pointe.

Translated Description (Spanish)

Resumen En el contexto de una mejor navegación para microvehículos aéreos, se propone un nuevo descriptor visual de reconocimiento de escenas, llamado descriptor espacial de ondas de color GIST (SCGWD). SCGWD se desarrolló combinando los descriptores de wavelet color-GIST de Ohta propuestos con los descriptores de representación de la pirámide espacial del histograma de transformación del censo (CENTRISTA) para categorizar escenas interiores frente a exteriores. Se utilizó un clasificador de máquina de vectores de soporte (SVM) binario y multiclase con núcleos lineales y no lineales para clasificar escenas interiores frente a exteriores y escenas interiores, respectivamente. En este documento, también hemos discutido la metodología de extracción de características de varios descriptores visuales de última generación y cuatro descriptores visuales propuestos (descriptores Ohta color-GIST, descriptores de wavelet Ohta color-GIST, descriptores de histograma de color Ohta mejorado y SCGWDs), en términos de perspectivas experimentales. Se evaluaron los descriptores de histograma de color Ohta mejorados propuestos, los descriptores de color Ohta-GIST, los descriptores de wavelet de color Ohta-GIST, SCGWD y los descriptores visuales de última generación, utilizando la base de datos de imágenes de clasificación de escenas de Madras del Instituto Indio de Tecnología dos, un conjunto de datos de interiores y exteriores y el conjunto de datos de clasificación de escenas de interiores del Instituto de Tecnología de Massachusetts [(MIT)-67]. Los resultados experimentales mostraron que el algoritmo de reconocimiento de escenas interiores versus exteriores, que emplea SVM con SCGWD, produjo las tasas de clasificación más altas (CR) -95.48% y 99.82% utilizando el núcleo de función de base radial (RBF) y 95.29% y 99.45% utilizando el núcleo lineal para los conjuntos de datos IITM SCID2 e Indoor-Outdoor, respectivamente. Los CR más bajos, 2,08% y 4,92%, respectivamente, se obtuvieron cuando se utilizaron RBF y núcleos lineales con el conjunto de datos MIT-67. Además, se obtuvieron valores más altos de CR, precisión, recuperación y área bajo la curva característica operativa del receptor para los SCGWD propuestos, en comparación con los descriptores visuales del estado de la técnica.

Files

s42492-019-0030-9.pdf

Files (2.4 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:dfa7e77b3d05ce7f0828b7a3cdb0f379
2.4 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
التعرف على المشهد في الأماكن المغلقة مقابل في الهواء الطلق للملاحة في مركبة جوية صغيرة باستخدام أوصاف الموجات الموجية الملونة المكانية
Translated title (French)
Reconnaissance de la scène intérieure par rapport à la scène extérieure pour la navigation d'un micro-véhicule aérien à l'aide de descripteurs d'ondelettes de couleur spatiale
Translated title (Spanish)
Reconocimiento de escenas en interiores frente a exteriores para la navegación de un microvehículo aéreo utilizando descriptores espaciales de ondas GIST de color

Identifiers

Other
https://openalex.org/W2990835441
DOI
10.1186/s42492-019-0030-9

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
India

References

  • https://openalex.org/W1532257412
  • https://openalex.org/W1966185718
  • https://openalex.org/W1968677218
  • https://openalex.org/W1970323662
  • https://openalex.org/W1976789757
  • https://openalex.org/W1984910340
  • https://openalex.org/W1997428597
  • https://openalex.org/W2010560725
  • https://openalex.org/W2014481529
  • https://openalex.org/W2017814585
  • https://openalex.org/W2018380704
  • https://openalex.org/W2027922120
  • https://openalex.org/W2056626446
  • https://openalex.org/W2071428855
  • https://openalex.org/W2104825706
  • https://openalex.org/W2113855951
  • https://openalex.org/W2119605622
  • https://openalex.org/W2140582552
  • https://openalex.org/W2151103935
  • https://openalex.org/W2152161678
  • https://openalex.org/W2154741421
  • https://openalex.org/W2161969291
  • https://openalex.org/W2168584046
  • https://openalex.org/W2184925475
  • https://openalex.org/W2745234869
  • https://openalex.org/W2801041578
  • https://openalex.org/W2956033164
  • https://openalex.org/W591046810