Published August 2, 2023 | Version v1
Publication Open

Statistical Analysis of Design Aspects of Various YOLO-Based Deep Learning Models for Object Detection

  • 1. SRM University
  • 2. Siddhartha Medical College
  • 3. Institute of Information Science and Technologies
  • 4. National Research Council

Description

Abstract Object detection is a critical and complex problem in computer vision, and deep neural networks have significantly enhanced their performance in the last decade. There are two primary types of object detectors: two stage and one stage. Two-stage detectors use a complex architecture to select regions for detection, while one-stage detectors can detect all potential regions in a single shot. When evaluating the effectiveness of an object detector, both detection accuracy and inference speed are essential considerations. Two-stage detectors usually outperform one-stage detectors in terms of detection accuracy. However, YOLO and its predecessor architectures have substantially improved detection accuracy. In some scenarios, the speed at which YOLO detectors produce inferences is more critical than detection accuracy. This study explores the performance metrics, regression formulations, and single-stage object detectors for YOLO detectors. Additionally, it briefly discusses various YOLO variations, including their design, performance, and use cases.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يعد اكتشاف الأجسام المجردة مشكلة حرجة ومعقدة في رؤية الكمبيوتر، وقد عززت الشبكات العصبية العميقة أدائها بشكل كبير في العقد الماضي. هناك نوعان أساسيان من كاشفات الأجسام: مرحلتان ومرحلة واحدة. تستخدم الكواشف ذات المرحلتين بنية معقدة لتحديد مناطق الكشف، بينما يمكن للكواشف ذات المرحلة الواحدة اكتشاف جميع المناطق المحتملة في لقطة واحدة. عند تقييم فعالية كاشف الأجسام، تعد كل من دقة الكشف وسرعة الاستدلال من الاعتبارات الأساسية. عادة ما تتفوق أجهزة الكشف ذات المرحلتين على أجهزة الكشف ذات المرحلة الواحدة من حيث دقة الكشف. ومع ذلك، فقد حسنت YOLO والهياكل السابقة لها دقة الكشف بشكل كبير. في بعض السيناريوهات، تكون السرعة التي تنتج بها كاشفات YOLO استنتاجات أكثر أهمية من دقة الكشف. تستكشف هذه الدراسة مقاييس الأداء وصيغ الانحدار وكاشفات الأجسام أحادية المرحلة لكواشف YOLO. بالإضافة إلى ذلك، يناقش بإيجاز اختلافات YOLO المختلفة، بما في ذلك تصميمها وأدائها وحالات الاستخدام.

Translated Description (French)

Résumé La détection d'objets est un problème critique et complexe en vision par ordinateur, et les réseaux de neurones profonds ont considérablement amélioré leurs performances au cours de la dernière décennie. Il existe deux principaux types de détecteurs d'objets : deux étages et un étage. Les détecteurs à deux étages utilisent une architecture complexe pour sélectionner les régions à détecter, tandis que les détecteurs à un étage peuvent détecter toutes les régions potentielles en un seul coup. Lors de l'évaluation de l'efficacité d'un détecteur d'objets, la précision de la détection et la vitesse d'inférence sont des considérations essentielles. Les détecteurs à deux étages surpassent généralement les détecteurs à un étage en termes de précision de détection. Cependant, YOLO et ses architectures prédécesseurs ont considérablement amélioré la précision de la détection. Dans certains scénarios, la vitesse à laquelle les détecteurs Yolo produisent des inférences est plus critique que la précision de la détection. Cette étude explore les métriques de performance, les formulations de régression et les détecteurs d'objets à un seul étage pour les détecteurs Yolo. En outre, il discute brièvement de diverses variantes de YOLO, y compris leur conception, leurs performances et leurs cas d'utilisation.

Translated Description (Spanish)

La detección de objetos es un problema crítico y complejo en la visión artificial, y las redes neuronales profundas han mejorado significativamente su rendimiento en la última década. Hay dos tipos principales de detectores de objetos: dos etapas y una etapa. Los detectores de dos etapas utilizan una arquitectura compleja para seleccionar regiones para la detección, mientras que los detectores de una etapa pueden detectar todas las regiones potenciales en un solo disparo. Al evaluar la efectividad de un detector de objetos, tanto la precisión de detección como la velocidad de inferencia son consideraciones esenciales. Los detectores de dos etapas generalmente superan a los detectores de una etapa en términos de precisión de detección. Sin embargo, Yolo y sus arquitecturas predecesoras han mejorado sustancialmente la precisión de detección. En algunos escenarios, la velocidad a la que los detectores Yolo producen inferencias es más crítica que la precisión de la detección. Este estudio explora las métricas de rendimiento, las formulaciones de regresión y los detectores de objetos de una sola etapa para los detectores Yolo. Además, analiza brevemente varias variaciones de Yolo, incluido su diseño, rendimiento y casos de uso.

Files

s44196-023-00302-w.pdf.pdf

Files (2.1 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:86a52dc5cdd7959ddea5bb1e2131af09
2.1 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
التحليل الإحصائي لجوانب التصميم لمختلف نماذج التعلم العميق القائمة على YOLO للكشف عن الكائنات
Translated title (French)
Analyse statistique des aspects de conception de divers modèles d'apprentissage profond basés sur Yolo pour la détection d'objets
Translated title (Spanish)
Análisis estadístico de los aspectos de diseño de varios modelos de aprendizaje profundo basados en Yolo para la detección de objetos

Identifiers

Other
https://openalex.org/W4385495695
DOI
10.1007/s44196-023-00302-w

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
India

References

  • https://openalex.org/W1861492603
  • https://openalex.org/W1934184906
  • https://openalex.org/W2025291942
  • https://openalex.org/W2037227137
  • https://openalex.org/W2097162157
  • https://openalex.org/W2108598243
  • https://openalex.org/W2265846598
  • https://openalex.org/W2335999708
  • https://openalex.org/W2336509392
  • https://openalex.org/W2601706822
  • https://openalex.org/W2735810309
  • https://openalex.org/W2746802549
  • https://openalex.org/W2889418103
  • https://openalex.org/W2898663682
  • https://openalex.org/W2917763980
  • https://openalex.org/W2939033529
  • https://openalex.org/W2945904398
  • https://openalex.org/W2962374310
  • https://openalex.org/W2962752334
  • https://openalex.org/W2962970995
  • https://openalex.org/W2963037989
  • https://openalex.org/W2963047498
  • https://openalex.org/W2963446712
  • https://openalex.org/W2963920996
  • https://openalex.org/W2971587923
  • https://openalex.org/W2973696262
  • https://openalex.org/W3042011474
  • https://openalex.org/W3048201280
  • https://openalex.org/W3085201316
  • https://openalex.org/W3105153358
  • https://openalex.org/W3124817219
  • https://openalex.org/W3130717934
  • https://openalex.org/W3134467615
  • https://openalex.org/W3146332956
  • https://openalex.org/W3163510280
  • https://openalex.org/W3180134609
  • https://openalex.org/W3203464207
  • https://openalex.org/W4210598935
  • https://openalex.org/W4214581176
  • https://openalex.org/W4214777054
  • https://openalex.org/W4291819654
  • https://openalex.org/W4292178968
  • https://openalex.org/W4292512910
  • https://openalex.org/W4296019571
  • https://openalex.org/W4296341783
  • https://openalex.org/W4311716514
  • https://openalex.org/W4311959520
  • https://openalex.org/W4312627839
  • https://openalex.org/W4313579021
  • https://openalex.org/W4324137270
  • https://openalex.org/W4383673562
  • https://openalex.org/W4385800646
  • https://openalex.org/W4386076325
  • https://openalex.org/W4386985033
  • https://openalex.org/W4388720611