Published January 1, 2023 | Version v1
Publication Open

Parallel FPGA Routers With Lagrange Relaxation

  • 1. Atal Bihari Vajpayee Indian Institute of Information Technology and Management
  • 2. Indian Institute of Technology Indore
  • 3. Columbia University
  • 4. Tunisia Polytechnic School
  • 5. TU Dresden

Description

Routing of the nets in Field Programmable Gate Array (FPGA) design flow is one of the most time consuming steps. Although Versatile Place and Route (VPR), which is a commonly used algorithm for this purpose, routes effectively, it is slow in execution. One way to accelerate this design flow is to use parallelization. Since VPR is intrinsically sequential, a set of parallel algorithms have been recently proposed for this purpose (ParaLaR and ParaLarPD). These algorithms formulate the routing process as a Linear Program (LP) and solve it using the Lagrange relaxation, an adapted sub-gradient method, and a Steiner tree algorithm. When tested on the MCNC benchmark circuits, using underlying VPR 7.0 for packing and placement, ParaLaR and ParaLarPD both outperformed VPR 7.0 for routing, with ParaLarPD being better. We have three main contributions here. Recently, in 2020, a new variant of VPR, i.e. VPR 8.0, has been proposed. Hence, first, we make ParaLarPD compatible for testing on MCNC benchmark circuits using VPR 8.0. Second, we adapt ParaLarPD for the larger benchmark circuits than MCNC, i.e., VTR, using both VPR 7.0 and VPR 8.0, and perform thorough evaluation. Finally, and third, we improve ParaLarPD further. We design a family of Lagrange heuristics that better the Lagrange relaxation process of ParaLarPD. We term our new algorithm ParaLarH and test it on both the benchmark circuits (MCNC and VTR) and using both the VPRs (VPR 7.0 and VPR 8.0). When tested on MCNC and VTR benchmark circuits, VPR (VPR 7.0 and VPR 8.0) is outperformed by both ParaLarH and ParaLarPD, with average gains given below. The minimum channel width improvements are 22% and 12%, respectively. The total wire length improvements for both are 45%. Finally, the average critical path delay improvements for both are almost the same (37% and 35%, respectively).

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يعد توجيه الشبكات في تدفق تصميم مصفوفة البوابة القابلة للبرمجة الميدانية (FPGA) أحد أكثر الخطوات استهلاكا للوقت. على الرغم من أن المكان والطريق متعدد الاستخدامات (VPR)، وهي خوارزمية شائعة الاستخدام لهذا الغرض، إلا أنها تسير بشكل فعال، إلا أنها بطيئة في التنفيذ. تتمثل إحدى طرق تسريع تدفق التصميم هذا في استخدام التوازي. نظرًا لأن VPR متسلسل جوهريًا، فقد تم اقتراح مجموعة من الخوارزميات المتوازية مؤخرًا لهذا الغرض (ParaLaR و ParaLarPD). تقوم هذه الخوارزميات بصياغة عملية التوجيه كبرنامج خطي (LP) وحلها باستخدام استرخاء لاغرانج، وطريقة التدرج الفرعي المعدلة، وخوارزمية شجرة شتاينر. عند اختبارها على الدوائر المعيارية MCNC، باستخدام VPR 7.0 الأساسي للتعبئة والتنسيب، تفوقت ParaLaR و ParaLarPD على VPR 7.0 للتوجيه، مع ParaLarPD أفضل. لدينا ثلاث مساهمات رئيسية هنا. في الآونة الأخيرة، في عام 2020، تم اقتراح متغير جديد من VPR، أي VPR 8.0. وبالتالي، أولاً، نجعل ParaLarPD متوافقًا للاختبار على الدوائر المعيارية MCNC باستخدام VPR 8.0. ثانيًا، نقوم بتكييف ParaLarPD للدوائر المعيارية الأكبر من MCNC، أي VTR، باستخدام كل من VPR 7.0 و VPR 8.0، وإجراء تقييم شامل. أخيرًا، وثالثًا، نقوم بتحسين ParaLarPD بشكل أكبر. نحن نصمم عائلة من استدلالات LAGRANGE التي تعمل على تحسين عملية استرخاء LAGRANGE في ParaLarPD. نصطلح خوارزميتنا الجديدة ParaLarH ونختبرها على كل من الدوائر المعيارية (MCNC و VTR) وباستخدام كل من VPRs (VPR 7.0 و VPR 8.0). عند اختباره على الدوائر المعيارية MCNC و VTR، يتفوق كل من ParaLarH و ParaLarPD على VPR (VPR 7.0 و VPR 8.0)، مع متوسط المكاسب الواردة أدناه. الحد الأدنى للتحسينات في عرض القناة هو 22 ٪ و 12 ٪ على التوالي. يبلغ إجمالي تحسينات طول السلك لكليهما 45 ٪. أخيرًا، فإن متوسط تحسينات تأخير المسار الحرج لكليهما هو نفسه تقريبًا (37 ٪ و 35 ٪ على التوالي).

Translated Description (French)

Le routage des réseaux dans le flux de conception FPGA (Field Programmable Gate Array) est l'une des étapes les plus chronophages. Bien que Versatile Place and Route (VPR), qui est un algorithme couramment utilisé à cette fin, achemine efficacement, son exécution est lente. Une façon d'accélérer ce flux de conception est d'utiliser la parallélisation. La VPR étant intrinsèquement séquentielle, un ensemble d'algorithmes parallèles ont été récemment proposés à cet effet (ParaLaR et ParaLarPD). Ces algorithmes formulent le processus de routage comme un programme linéaire (LP) et le résolvent en utilisant la relaxation de Lagrange, une méthode de sous-gradient adaptée et un algorithme d'arbre de Steiner. Lorsqu'ils ont été testés sur les circuits de référence MCNC, en utilisant VPR 7.0 sous-jacent pour l'emballage et le placement, ParaLaR et ParaLarPD ont tous deux surperformé VPR 7.0 pour le routage, ParaLarPD étant meilleur. Nous avons ici trois contributions principales. Récemment, en 2020, une nouvelle variante de VPR, à savoir VPR 8.0, a été proposée. Par conséquent, tout d'abord, nous rendons ParaLarPD compatible pour les tests sur les circuits de référence MCNC à l'aide de VPR 8.0. Deuxièmement, nous adaptons ParaLarPD pour les circuits de référence plus grands que MCNC, c'est-à-dire VTR, en utilisant à la fois VPR 7.0 et VPR 8.0, et effectuons une évaluation approfondie. Enfin, et troisièmement, nous améliorons davantage ParaLarPD. Nous concevons une famille d'heuristiques de Lagrange qui améliorent le processus de relaxation de Lagrange de ParaLarPD. Nous appelons notre nouvel algorithme ParaLarH et le testons à la fois sur les circuits de référence (MCNC et VTR) et en utilisant les deux VPR (VPR 7.0 et VPR 8.0). Lorsqu'il est testé sur des circuits de référence MCNC et VTR, VPR (VPR 7.0 et VPR 8.0) est surperformé par ParaLarH et ParaLarPD, avec des gains moyens indiqués ci-dessous. Les améliorations minimales de la largeur du canal sont de 22 % et 12 %, respectivement. Les améliorations totales de la longueur du fil pour les deux sont de 45 %. Enfin, les améliorations moyennes du délai du chemin critique pour les deux sont presque les mêmes (37 % et 35 %, respectivement).

Translated Description (Spanish)

El enrutamiento de las redes en el flujo de diseño de Field Programmable Gate Array (FPGA) es uno de los pasos que más tiempo consume. Aunque Versatile Place and Route (VPR), que es un algoritmo comúnmente utilizado para este propósito, enruta de manera efectiva, su ejecución es lenta. Una forma de acelerar este flujo de diseño es utilizar la paralelización. Dado que VPR es intrínsecamente secuencial, recientemente se ha propuesto un conjunto de algoritmos paralelos para este propósito (ParaLaR y ParaLarPD). Estos algoritmos formulan el proceso de enrutamiento como un Programa Lineal (LP) y lo resuelven utilizando la relajación de Lagrange, un método de subgradiente adaptado y un algoritmo de árbol de Steiner. Cuando se probaron en los circuitos de referencia MCNC, utilizando VPR 7.0 subyacente para el embalaje y la colocación, ParaLaR y ParaLarPD superaron a VPR 7.0 para el enrutamiento, siendo ParaLarPD mejor. Tenemos tres contribuciones principales aquí. Recientemente, en 2020, se ha propuesto una nueva variante de VPR, es decir, VPR 8.0. Por lo tanto, en primer lugar, hacemos que ParaLarPD sea compatible para realizar pruebas en circuitos de referencia MCNC utilizando VPR 8.0. En segundo lugar, adaptamos ParaLarPD para los circuitos de referencia más grandes que MCNC, es decir, VTR, utilizando VPR 7.0 y VPR 8.0, y realizamos una evaluación exhaustiva. Por último, y en tercer lugar, mejoramos aún más ParaLarPD. Diseñamos una familia de heurísticas de Lagrange que mejoran el proceso de relajación de Lagrange de ParaLarPD. Denominamos nuestro nuevo algoritmo ParaLarH y lo probamos tanto en los circuitos de referencia (MCNC y VTR) como en los VPR (VPR 7.0 y VPR 8.0). Cuando se prueba en circuitos de referencia MCNC y VTR, VPR (VPR 7.0 y VPR 8.0) es superado tanto por ParaLarH como por ParaLarPD, con ganancias medias que se indican a continuación. Las mejoras mínimas de ancho de canal son del 22% y 12%, respectivamente. Las mejoras totales en la longitud del cable para ambos son del 45%. Finalmente, las mejoras medias del retardo de la ruta crítica para ambos son casi las mismas (37% y 35%, respectivamente).

Files

10301420.pdf.pdf

Files (245 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:659912a210bdb7ededf02d86c3a8275b
245 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
أجهزة توجيه FPGA متوازية مع استرخاء LAGRANGE
Translated title (French)
Routeurs FPGA parallèles avec relaxation Lagrange
Translated title (Spanish)
Routers FPGA paralelos con relajación Lagrange

Identifiers

Other
https://openalex.org/W4388107951
DOI
10.1109/access.2023.3328769

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Tunisia

References

  • https://openalex.org/W1632217358
  • https://openalex.org/W1986517752
  • https://openalex.org/W1996118534
  • https://openalex.org/W2002057529
  • https://openalex.org/W2005602803
  • https://openalex.org/W2012130001
  • https://openalex.org/W2023428606
  • https://openalex.org/W2093903024
  • https://openalex.org/W2108463163
  • https://openalex.org/W2139637699
  • https://openalex.org/W2169713291
  • https://openalex.org/W2229839854
  • https://openalex.org/W2252440427
  • https://openalex.org/W2292739431
  • https://openalex.org/W2475189474
  • https://openalex.org/W2757616806
  • https://openalex.org/W2782525255
  • https://openalex.org/W2889043643
  • https://openalex.org/W2895952230
  • https://openalex.org/W2905090969
  • https://openalex.org/W2954711311
  • https://openalex.org/W2970192067
  • https://openalex.org/W2989866921
  • https://openalex.org/W3016944287
  • https://openalex.org/W3135333817
  • https://openalex.org/W3165200223
  • https://openalex.org/W3207768656
  • https://openalex.org/W3208758617
  • https://openalex.org/W4220835434
  • https://openalex.org/W4236384091