Published July 12, 2022 | Version v1
Publication Open

An efficient hardware implementation of CNN-based object trackers for real-time applications

  • 1. Cairo University
  • 2. Al Azhar University

Description

Abstract The object tracking field continues to evolve as an important application of computer vision. Real-time performance is typically required in most applications of object tracking. The recent introduction of Convolutional Neural network (CNN) techniques to the object tracking field enabled the attainment of significant performance gains. However, the heavy computational load required for CNNs conflicts with the real-time requirements required for object tracking. In this paper, we address these computational limitations on the algorithm-side and the circuit-side. On the algorithm side, we adopt interpolation schemes which can significantly reduce the processing time and the memory storage requirements. We also evaluate the approximation of the hardware-expensive computations to attain an efficient hardware design. Moreover, we modify the online-training scheme in order to achieve a constant processing time across all video frames. On the circuit side, we developed a hardware accelerator of the online training stage. We avoid transposed reading from the external memory to speed-up the data movement with no performance degradation. Our proposed hardware accelerator achieves 44 frames-per-second in training the fully connected layers.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

الملخص يستمر مجال تتبع الكائن في التطور كتطبيق مهم لرؤية الكمبيوتر. عادة ما يكون الأداء في الوقت الفعلي مطلوبًا في معظم تطبيقات تتبع الكائنات. أتاح الإدخال الأخير لتقنيات الشبكة العصبية الالتفافية (CNN) في مجال تتبع الكائنات تحقيق مكاسب كبيرة في الأداء. ومع ذلك، فإن الحمل الحسابي الثقيل المطلوب لـ CNNs يتعارض مع متطلبات الوقت الفعلي المطلوبة لتتبع الكائن. في هذه الورقة، نتناول هذه القيود الحسابية على جانب الخوارزمية وجانب الدائرة. على جانب الخوارزمية، نعتمد مخططات الاستيفاء التي يمكن أن تقلل بشكل كبير من وقت المعالجة ومتطلبات تخزين الذاكرة. نقوم أيضًا بتقييم تقريب الحسابات باهظة الثمن للأجهزة لتحقيق تصميم فعال للأجهزة. علاوة على ذلك، نقوم بتعديل نظام التدريب عبر الإنترنت من أجل تحقيق وقت معالجة ثابت عبر جميع إطارات الفيديو. على جانب الدائرة، قمنا بتطوير مسرع الأجهزة لمرحلة التدريب عبر الإنترنت. نتجنب القراءة المنقولة من الذاكرة الخارجية لتسريع حركة البيانات دون أي تدهور في الأداء. يحقق مسرع الأجهزة المقترح لدينا 44 إطارًا في الثانية في تدريب الطبقات المتصلة بالكامل.

Translated Description (French)

Résumé Le domaine du suivi d'objets continue d'évoluer en tant qu'application importante de la vision par ordinateur. Les performances en temps réel sont généralement requises dans la plupart des applications de suivi d'objets. L'introduction récente de techniques de réseau neuronal convolutionnel (CNN) dans le domaine du suivi d'objets a permis d'obtenir des gains de performance significatifs. Cependant, la lourde charge de calcul requise pour les CNN est en conflit avec les exigences en temps réel requises pour le suivi des objets. Dans cet article, nous abordons ces limitations de calcul côté algorithme et côté circuit. Du côté de l'algorithme, nous adoptons des schémas d'interpolation qui peuvent réduire considérablement le temps de traitement et les exigences de stockage de la mémoire. Nous évaluons également l'approximation des calculs coûteux en matériel pour atteindre une conception matérielle efficace. De plus, nous modifions le schéma de formation en ligne afin d'obtenir un temps de traitement constant sur toutes les images vidéo. Côté circuit, nous avons développé un accélérateur matériel de la phase de formation en ligne. Nous évitons de transposer la lecture de la mémoire externe pour accélérer le mouvement des données sans dégradation des performances. Notre accélérateur matériel proposé atteint 44 images par seconde dans la formation des couches entièrement connectées.

Translated Description (Spanish)

Resumen El campo de seguimiento de objetos continúa evolucionando como una aplicación importante de la visión artificial. El rendimiento en tiempo real suele ser necesario en la mayoría de las aplicaciones de seguimiento de objetos. La reciente introducción de las técnicas de redes neuronales convolucionales (CNN) en el campo de seguimiento de objetos permitió lograr importantes ganancias de rendimiento. Sin embargo, la pesada carga computacional requerida para las CNN entra en conflicto con los requisitos en tiempo real requeridos para el seguimiento de objetos. En este artículo, abordamos estas limitaciones computacionales en el lado del algoritmo y en el lado del circuito. Por el lado del algoritmo, adoptamos esquemas de interpolación que pueden reducir significativamente el tiempo de procesamiento y los requisitos de almacenamiento en memoria. También evaluamos la aproximación de los costosos cálculos de hardware para lograr un diseño de hardware eficiente. Además, modificamos el esquema de formación online para conseguir un tiempo de procesamiento constante en todos los fotogramas de vídeo. Por el lado del circuito, desarrollamos un acelerador de hardware de la etapa de formación online. Evitamos la lectura transpuesta de la memoria externa para acelerar el movimiento de datos sin degradación del rendimiento. Nuestro acelerador de hardware propuesto logra 44 fotogramas por segundo en el entrenamiento de las capas totalmente conectadas.

Files

s00521-022-07538-1.pdf.pdf

Files (2.5 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:9ad31c704db048af61caa6512ed26ebb
2.5 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
تنفيذ فعال للأجهزة لأجهزة تتبع الكائنات المستندة إلى CNN للتطبيقات في الوقت الفعلي
Translated title (French)
Une implémentation matérielle efficace de traqueurs d'objets basés sur CNN pour des applications en temps réel
Translated title (Spanish)
Una implementación de hardware eficiente de rastreadores de objetos basados en CNN para aplicaciones en tiempo real

Identifiers

Other
https://openalex.org/W4285091444
DOI
10.1007/s00521-022-07538-1

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Egypt

References

  • https://openalex.org/W1857884451
  • https://openalex.org/W2158592639
  • https://openalex.org/W2161969291
  • https://openalex.org/W2244956674
  • https://openalex.org/W2408241409
  • https://openalex.org/W2470394683
  • https://openalex.org/W2518013266
  • https://openalex.org/W2590016403
  • https://openalex.org/W2593882908
  • https://openalex.org/W2594492285
  • https://openalex.org/W2608093348
  • https://openalex.org/W2738318237
  • https://openalex.org/W2766641843
  • https://openalex.org/W2800329759
  • https://openalex.org/W2902138814
  • https://openalex.org/W2906917284
  • https://openalex.org/W2910396952
  • https://openalex.org/W2951045917
  • https://openalex.org/W2962764251
  • https://openalex.org/W2963173190
  • https://openalex.org/W2964123402
  • https://openalex.org/W2964253307
  • https://openalex.org/W3046387293
  • https://openalex.org/W3092582417
  • https://openalex.org/W3161184817
  • https://openalex.org/W4247924304