Generating Performance Analysis of GPU compared to Single-core and Multi-core CPU for Natural Language Applications
Creators
- 1. Master's College
- 2. Vellore Institute of Technology University
Description
In Natural Language Processing (NLP) applications, the main time-consuming process is string matching due to the large size of lexicon.In string matching processes, data dependence is minimal and hence it is ideal for parallelization.A dedicated system with memory interleaving and parallel processing techniques for string matching can reduce this burden of host CPU, thereby making the system more suitable for real-time applications.Now it is possible to apply parallelism using multi-cores on CPU, though they need to be used explicitly to achieve high performance.Recent GPUs hold a large number of cores, and have a potential for high performance in many general purpose applications.Programming tools for multi-cores on CPU and a large number of cores on GPU have been formulated, but it is still difficult to achieve high performance on these platforms.In this paper, we compare the performance of single-core, multi-core CPU and GPU using such a Natural Language Processing application.
Translated Descriptions
Translated Description (Arabic)
في تطبيقات معالجة اللغة الطبيعية (NLP)، تتمثل العملية الرئيسية التي تستغرق وقتًا طويلاً في مطابقة السلاسل بسبب الحجم الكبير للمعجم. في عمليات مطابقة السلاسل، يكون الاعتماد على البيانات ضئيلًا وبالتالي فهو مثالي للتوازي. يمكن لنظام مخصص مع تشابك الذاكرة وتقنيات المعالجة المتوازية لمطابقة السلاسل أن يقلل من عبء وحدة المعالجة المركزية المضيفة، مما يجعل النظام أكثر ملاءمة للتطبيقات في الوقت الفعلي. الآن من الممكن تطبيق التوازي باستخدام النوى المتعددة على وحدة المعالجة المركزية، على الرغم من أنها تحتاج إلى استخدامها بشكل صريح لتحقيق أداء عالٍ. تحتوي وحدات معالجة الرسومات الحديثة على عدد كبير من النوى، ولها إمكانية الأداء العالي في العديد من تطبيقات الأغراض العامة. تمت صياغة أدوات البرمجة للنوى المتعددة على وحدة المعالجة المركزية وعدد كبير من النوى على وحدة المعالجة المركزية، ولكن لا يزال من الصعب تحقيق أداء عالٍ على هذه المنصات. في هذه الورقة، نقارن أداء وحدة المعالجة المركزية أحادية النواة ومتعددة النواة ووحدة معالجة الرسومات باستخدام تطبيق معالجة اللغة الطبيعية هذا.Translated Description (French)
Dans les applications de traitement du langage naturel (NLP), le principal processus chronophage est la correspondance de chaînes en raison de la grande taille du lexique. Dans les processus de correspondance de chaînes, la dépendance des données est minimale et elle est donc idéale pour la parallélisation. Un système dédié avec des techniques d'entrelacement de mémoire et de traitement parallèle pour la correspondance de chaînes peut réduire cette charge du processeur hôte, rendant ainsi le système plus adapté aux applications en temps réel. Maintenant, il est possible d'appliquer le parallélisme en utilisant des multi-cœurs sur le processeur, bien qu'ils doivent être utilisés explicitement pour atteindre de hautes performances. Les GPU récents détiennent un grand nombre de cœurs et ont un potentiel de hautes performances dans de nombreuses applications à usage général. Des outils de programmation pour les multi-cœurs sur le processeur et un grand nombre de cœurs sur le GPU ont été formulés, mais il est toujours difficile d'atteindre de hautes performances sur ces plates-formes. Dans cet article, nous comparons les performances du processeur et du GPU monocœurs et multicœurs en utilisant une telle application de traitement du langage naturel.Translated Description (Spanish)
En las aplicaciones de procesamiento de lenguaje natural (PNL), el proceso principal que consume mucho tiempo es la coincidencia de cadenas debido al gran tamaño del léxico. En los procesos de coincidencia de cadenas, la dependencia de datos es mínima y, por lo tanto, es ideal para la paralelización. Un sistema dedicado con intercalado de memoria y técnicas de procesamiento paralelo para la coincidencia de cadenas puede reducir esta carga de la CPU host, lo que hace que el sistema sea más adecuado para aplicaciones en tiempo real. Ahora es posible aplicar paralelismo utilizando múltiples núcleos en la CPU, aunque deben usarse explícitamente para lograr un alto rendimiento. Las GPU recientes tienen un gran número de núcleos y tienen un potencial de alto rendimiento en muchas aplicaciones de propósito general. Se han formulado herramientas de programación para múltiples núcleos en la CPU y un gran número de núcleos en la GPU, pero todavía es difícil lograr un alto rendimiento en estas plataformas. En este documento, comparamos el rendimiento de la CPU y GPU de un solo núcleo y múltiples núcleos que utilizan dicha aplicación de procesamiento de lenguaje natural.Files
Paper%208-Performance%20Analysis%20of%20GPU%20compared%20to%20Single-core%20and%20Multi-core%20CPU%20for%20Natural%20Language%20Applications.pdf.pdf
Files
(393.0 kB)
Name | Size | Download all |
---|---|---|
md5:6c4a089339c276acf06d3e1655354f41
|
393.0 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- توليد تحليل أداء وحدة معالجة الرسومات مقارنة بوحدة المعالجة المركزية أحادية النواة ومتعددة النواة لتطبيقات اللغة الطبيعية
- Translated title (French)
- Génération d'une analyse des performances du processeur graphique par rapport au processeur monocœur et multicœur pour les applications en langage naturel
- Translated title (Spanish)
- Generación de análisis de rendimiento de GPU en comparación con CPU de un solo núcleo y multinúcleo para aplicaciones de lenguaje natural
Identifiers
- Other
- https://openalex.org/W2161570220
- DOI
- 10.14569/ijacsa.2011.020508
References
- https://openalex.org/W2069976976
- https://openalex.org/W2157144208
- https://openalex.org/W2295862081