Published October 1, 2022 | Version v1
Publication Open

Vehicle and Pedestrian Detection Algorithm Based on Lightweight YOLOv3-Promote and Semi-Precision Acceleration

  • 1. Nanjing University of Posts and Telecommunications
  • 2. Universidade do Estado do Rio de Janeiro
  • 3. Xianyang Normal University

Description

Aiming at the shortcomings of the current YOLOv3 model, such as large size, slow response speed, and difficulty in deploying to real devices, this paper reconstructs the target detection model YOLOv3, and proposes a new lightweight target detection network YOLOv3-promote: Firstly, the G-Module combined with the Depth-Wise convolution is used to construct the backbone network of the entire model, and the attention mechanism is introduced and added to perform weighting operations on each channel to get more key features and remove redundant features, thereby strengthening the identification ability of feature network model's to distinguish target objects among background; Secondly, in order to delete some less important channels to achieve the effect of compressing the model size and improving the calculation speed, the size of the scaling factor gamma in the batch normalization layer is used; Finally, based on NVIDIA's TensorRT framework model conversion and half-precision acceleration were carried out, and the accelerated model was successfully deployed on the embedded platform Jetson Nano. The performed KITTI experimental results show that the inference speed of our proposed method is about 5 times that of the original model, the parameter volume is reduced to one tenth, the mAP is increased from 86.1% of the original model to 93.1%, and the FPS reaches 25.5fps, realizing the requirements of real-time detection with high precision.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تهدف هذه الورقة إلى تحديد أوجه القصور في نموذج YOLOv3 الحالي، مثل الحجم الكبير وسرعة الاستجابة البطيئة وصعوبة النشر على الأجهزة الحقيقية، وتعيد هذه الورقة بناء نموذج الكشف عن الهدف YOLOv3، وتقترح شبكة جديدة للكشف عن الهدف خفيفة الوزن YOLOv3 -الترويج: أولاً، يتم استخدام وحدة G - Module جنبًا إلى جنب مع التفاف العمق الحكيم لبناء الشبكة الأساسية للنموذج بأكمله، ويتم إدخال آلية الانتباه وإضافتها لإجراء عمليات الترجيح على كل قناة للحصول على المزيد من الميزات الرئيسية وإزالة الميزات الزائدة عن الحاجة، وبالتالي تعزيز قدرة تحديد نموذج الشبكة المميزة على تمييز الكائنات المستهدفة بين الخلفية ؛ ثانيًا، من أجل حذف بعض القنوات الأقل أهمية لتحقيق تأثير ضغط حجم النموذج وتحسين سرعة الحساب، يتم استخدام حجم عامل التحجيم جاما في طبقة التطبيع الدفعة ؛ أخيرًا، استنادًا إلى تحويل نموذج TensorRT من NVIDIA والتسارع نصف الدقيق، تم تنفيذ النموذج ونشره بنجاح على المنصة المدمجة. تُظهر النتائج التجريبية لـ KITTI التي تم إجراؤها أن سرعة الاستدلال لطريقتنا المقترحة تبلغ حوالي 5 أضعاف سرعة النموذج الأصلي، ويتم تقليل حجم المعلمة إلى عُشر، وزيادة ماب من 86.1 ٪ من النموذج الأصلي إلى 93.1 ٪، وتصل FPS إلى 25.5 إطارًا في الثانية، مما يحقق متطلبات الكشف في الوقت الفعلي بدقة عالية.

Translated Description (French)

Visant les lacunes du modèle YOLOv3 actuel, telles que la grande taille, la vitesse de réponse lente et la difficulté de déploiement sur des dispositifs réels, cet article reconstruit le modèle de détection de cible YOLOv3 et propose un nouveau réseau de détection de cible léger YOLOv3-promotion : Premièrement, le module G combiné à la convolution en profondeur est utilisé pour construire le réseau de base de l'ensemble du modèle, et le mécanisme d'attention est introduit et ajouté pour effectuer des opérations de pondération sur chaque canal afin d'obtenir plus de fonctionnalités clés et de supprimer les fonctionnalités redondantes, renforçant ainsi la capacité d'identification des modèles de réseau de fonctionnalités pour distinguer les objets cibles en arrière-plan ; Deuxièmement, afin de supprimer certains canaux moins importants pour obtenir l'effet de compression de la taille du modèle et améliorer la vitesse de calcul, la taille du facteur d'échelle gamma dans la couche de normalisation du lot est utilisée ; Enfin, sur la base de la conversion du modèle de cadre TensorRT de NVIDIA et de l'accélération de demi-précision, le modèle accéléré a été déployé avec succès sur la plate-forme intégrée Jetson Nano. Les résultats expérimentaux KITTI réalisés montrent que la vitesse d'inférence de notre méthode proposée est environ 5 fois supérieure à celle du modèle original, que le volume des paramètres est réduit à un dixième, que le mAP est augmenté de 86,1 % du modèle original à 93,1 % et que le FPS atteint 25,5 ips, répondant ainsi aux exigences de détection en temps réel avec une grande précision.

Translated Description (Spanish)

Apuntando a las deficiencias del modelo actual de YOLOv3, como el gran tamaño, la velocidad de respuesta lenta y la dificultad de implementación en dispositivos reales, este documento reconstruye el modelo de detección de objetivos YOLOv3 y propone una nueva red de detección de objetivos liviana YOLOv3-promover: en primer lugar, el módulo G combinado con la convolución Profundidad-Sabia se utiliza para construir la red troncal de todo el modelo, y se introduce y agrega el mecanismo de atención para realizar operaciones de ponderación en cada canal para obtener más características clave y eliminar características redundantes, fortaleciendo así la capacidad de identificación de los modelos de red de características para distinguir los objetos objetivo entre el fondo; en segundo lugar, para eliminar algunos canales menos importantes para lograr el efecto de comprimir el tamaño del modelo y mejorar la velocidad de cálculo, se utiliza el tamaño del factor de escala gamma en la capa de normalización por lotes; Finalmente, se llevó a cabo la conversión del modelo de marco TensorRT de NVIDIA y la aceleración de media precisión, y el modelo acelerado se implementó con éxito en la plataforma integrada Jetson Nano. Los resultados experimentales de KITTI realizados muestran que la velocidad de inferencia de nuestro método propuesto es aproximadamente 5 veces mayor que la del modelo original, el volumen del parámetro se reduce a una décima parte, el mAP aumenta del 86.1% del modelo original al 93.1% y el FPS alcanza 25.5 fps, cumpliendo con los requisitos de detección en tiempo real con alta precisión.

Files

09669164.pdf.pdf

Files (245 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:ea9715ebb94067316afd4410bcb3a790
245 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
خوارزمية الكشف عن المركبات والمشاة بناءً على YOLOv3 خفيفة الوزن - تعزيز وتسارع شبه دقيق
Translated title (French)
Algorithme de détection des véhicules et des piétons basé sur l'accélération légère YOLOv3-Promote et semi-précision
Translated title (Spanish)
Algoritmo de detección de vehículos y peatones basado en la aceleración ligera de promoción y semi-precisión YOLOv3

Identifiers

Other
https://openalex.org/W4206125188
DOI
10.1109/tits.2021.3137253

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Brazil

References

  • https://openalex.org/W1536680647
  • https://openalex.org/W1895577753
  • https://openalex.org/W1928906481
  • https://openalex.org/W1977556410
  • https://openalex.org/W2102605133
  • https://openalex.org/W2109255472
  • https://openalex.org/W2115579991
  • https://openalex.org/W2150066425
  • https://openalex.org/W2194775991
  • https://openalex.org/W2570343428
  • https://openalex.org/W2609144136
  • https://openalex.org/W2752782242
  • https://openalex.org/W2773495332
  • https://openalex.org/W2884585870
  • https://openalex.org/W2891171053
  • https://openalex.org/W2941583869
  • https://openalex.org/W2962835968
  • https://openalex.org/W2962851801
  • https://openalex.org/W2963037989
  • https://openalex.org/W2963163009
  • https://openalex.org/W2963604034
  • https://openalex.org/W2963786238
  • https://openalex.org/W2964063558
  • https://openalex.org/W2981647593
  • https://openalex.org/W2982083293
  • https://openalex.org/W3018757597
  • https://openalex.org/W3034552520
  • https://openalex.org/W3035414587
  • https://openalex.org/W3046554305
  • https://openalex.org/W3092427874
  • https://openalex.org/W3109466111
  • https://openalex.org/W3124951096
  • https://openalex.org/W4293584584
  • https://openalex.org/W4297775537
  • https://openalex.org/W639708223