Sign Language Recognition Using Multiple Kernel Learning: A Case Study of Pakistan Sign Language
Creators
- 1. International Islamic University, Islamabad
- 2. COMSATS University Islamabad
- 3. Benha University
- 4. Misr International University
Description
All over the world, deaf people use sign language as the only reliable source of communication with each other as well as with normal people. These communicating signs are made up of the shape of the hand and movement. In Pakistan, deaf people use Pakistan sign language (PSL) as a means of communication with people. In scientific literature, many studies have been done on PSL recognition and classification. Most of these work focused on colored-based hands while some others are sensors and Kinect-based approaches. These techniques are costly and also avoid user-friendliness. In this paper, a technique is proposed for the recognition of thirty-six static alphabets of PSL using bare hands. The dataset is obtained from the sign language videos. At a later step, four vision-based features are extracted i.e. local binary patterns, a histogram of oriented gradients, edge-oriented histogram, and speeded up robust features. The extracted features are individually classified using Multiple kernel learning (MKL) in support vector machine (SVM). We employed a one-to-all approach for the implementation of basic binary SVM into the multi-class SVM. A voting scheme is adopted for the final recognition of PSL. The performance of the proposed technique is measured in terms of accuracy, precision, recall, and F-score. The simulation results are promising as compared with existing approaches.
Translated Descriptions
Translated Description (Arabic)
في جميع أنحاء العالم، يستخدم الصم لغة الإشارة باعتبارها المصدر الوحيد الموثوق للتواصل مع بعضهم البعض وكذلك مع الأشخاص العاديين. تتكون علامات التواصل هذه من شكل اليد والحركة. في باكستان، يستخدم الصم لغة الإشارة الباكستانية (PSL) كوسيلة للتواصل مع الناس. في الأدبيات العلمية، تم إجراء العديد من الدراسات حول التعرف على PSL وتصنيفه. ركزت معظم هذه الأعمال على الأيدي الملونة في حين أن البعض الآخر عبارة عن أجهزة استشعار ونهج قائم على Kinect. هذه التقنيات مكلفة وتتجنب أيضًا سهولة الاستخدام. في هذه الورقة، يتم اقتراح تقنية للتعرف على ستة وثلاثين أبجدية ثابتة من PSL باستخدام الأيدي العارية. يتم الحصول على مجموعة البيانات من مقاطع فيديو لغة الإشارة. في خطوة لاحقة، يتم استخراج أربع ميزات قائمة على الرؤية، أي الأنماط الثنائية المحلية، والمخطط التكراري للتدرجات الموجهة، والمخطط التكراري الموجه نحو الحافة، والميزات القوية المتسارعة. يتم تصنيف الميزات المستخرجة بشكل فردي باستخدام تعلم النواة المتعددة (MKL) في آلة ناقلات الدعم (SVM). لقد استخدمنا نهجًا شاملاً لتنفيذ SVM الثنائي الأساسي في SVM متعدد الطبقات. يتم اعتماد مخطط تصويت للاعتراف النهائي بـ PSL. يقاس أداء التقنية المقترحة من حيث الدقة والدقة والتذكر والنتيجة F. نتائج المحاكاة واعدة مقارنة بالنهج الحالية.Translated Description (French)
Partout dans le monde, les personnes sourdes utilisent la langue des signes comme seule source fiable de communication entre elles ainsi qu'avec les personnes normales. Ces signes communicants sont constitués de la forme de la main et du mouvement. Au Pakistan, les personnes sourdes utilisent la langue des signes pakistanaise (PSL) comme moyen de communication avec les gens. Dans la littérature scientifique, de nombreuses études ont été réalisées sur la reconnaissance et la classification des PSL. La plupart de ces travaux se sont concentrés sur les mains colorées, tandis que d'autres sont des capteurs et des approches basées sur Kinect. Ces techniques sont coûteuses et évitent également la convivialité. Dans cet article, une technique est proposée pour la reconnaissance de trente-six alphabets statiques de PSL à mains nues. L'ensemble de données est obtenu à partir des vidéos en langue des signes. À une étape ultérieure, quatre caractéristiques basées sur la vision sont extraites, à savoir des motifs binaires locaux, un histogramme de gradients orientés, un histogramme orienté vers les bords et des caractéristiques robustes accélérées. Les fonctionnalités extraites sont classées individuellement à l'aide de l'apprentissage à noyaux multiples (MKL) dans la machine à vecteurs de support (SVM). Nous avons utilisé une approche un-à-tout pour la mise en œuvre de SVM binaire de base dans le SVM multi-classe. Un schéma de vote est adopté pour la reconnaissance finale de PSL. Les performances de la technique proposée sont mesurées en termes de précision, de précision, de rappel et de F-score. Les résultats de la simulation sont prometteurs par rapport aux approches existantes.Translated Description (Spanish)
En todo el mundo, las personas sordas utilizan el lenguaje de señas como la única fuente confiable de comunicación entre sí, así como con personas normales. Estos signos de comunicación se componen de la forma de la mano y el movimiento. En Pakistán, las personas sordas utilizan el lenguaje de señas de Pakistán (PSL) como medio de comunicación con las personas. En la literatura científica, se han realizado muchos estudios sobre el reconocimiento y la clasificación de PSL. La mayoría de estos trabajos se centraron en manos basadas en colores, mientras que otros son sensores y enfoques basados en Kinect. Estas técnicas son costosas y también evitan la facilidad de uso. En este trabajo, se propone una técnica para el reconocimiento de treinta y seis alfabetos estáticos de PSL con las manos desnudas. El conjunto de datos se obtiene de los vídeos en lengua de signos. En un paso posterior, se extraen cuatro características basadas en la visión, es decir, patrones binarios locales, un histograma de gradientes orientados, un histograma orientado al borde y características robustas aceleradas. Las características extraídas se clasifican individualmente utilizando el aprendizaje de kernel múltiple (MKL) en la máquina de vectores de soporte (SVM). Empleamos un enfoque de uno a todos para la implementación de SVM binaria básica en la SVM multiclase. Se adopta un esquema de votación para el reconocimiento final de PSL. El rendimiento de la técnica propuesta se mide en términos de exactitud, precisión, recuerdo y puntuación F. Los resultados de la simulación son prometedores en comparación con los enfoques existentes.Additional details
Additional titles
- Translated title (Arabic)
- التعرف على لغة الإشارة باستخدام تعلم نواة متعددة: دراسة حالة للغة الإشارة الباكستانية
- Translated title (French)
- Reconnaissance de la langue des signes à l'aide de l'apprentissage à noyaux multiples : une étude de cas de la langue des signes pakistanaise
- Translated title (Spanish)
- Reconocimiento del lenguaje de señas mediante el aprendizaje de múltiples núcleos: un estudio de caso del lenguaje de señas de Pakistán
Identifiers
- Other
- https://openalex.org/W3161875647
- DOI
- 10.1109/access.2021.3077386
References
- https://openalex.org/W1906516266
- https://openalex.org/W1972679083
- https://openalex.org/W2039051707
- https://openalex.org/W2119605622
- https://openalex.org/W2126179605
- https://openalex.org/W2158141007
- https://openalex.org/W2161969291
- https://openalex.org/W2292942790
- https://openalex.org/W2293407568
- https://openalex.org/W2482513306
- https://openalex.org/W2545755700
- https://openalex.org/W2762032368
- https://openalex.org/W2895587657
- https://openalex.org/W2972882412
- https://openalex.org/W2996798951
- https://openalex.org/W3125649572