Feature Extraction Method for Improving Speech Recognition in Noisy Environments

doi:10.60692/40ekr-w7r62

Published February 1, 2016 | Version v1

Publication Open

Feature Extraction Method for Improving Speech Recognition in Noisy Environments

1. University of Carthage

The paper presents a feature extraction method, named as Normalized Gammachirp Cepstral Coefficients (NGCC) that incorporates the properties of the peripheral auditory system to improve robustness in noisy speech recognition.The proposed method is based on a second order low-pass filter and normalized gammachirp filterbank to emulate the mechanisms performed in the outer/middle ear and cochlea.The speech recognition performance of this method is conducted on the speech signals in real-world noisy environments.Experimental results demonstrate that method outperformed the classical feature extraction methods in terms of speech recognition rate.The used Hidden Markov Models based speech recognition system is employed on the HTK 3.4.1 platform (Hidden Markov Model Toolkit).

Translated Descriptions

This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تقدم الورقة طريقة استخراج ميزة، تسمى معاملات غاماشيرب المعيارية (NGCC) التي تتضمن خصائص النظام السمعي المحيطي لتحسين المتانة في التعرف على الكلام الصاخب. تعتمد الطريقة المقترحة على مرشح تمرير منخفض من الدرجة الثانية ومرشح غاماشيرب المعياري لمحاكاة الآليات التي يتم إجراؤها في الأذن الخارجية/الوسطى والقوقعة. يتم إجراء أداء التعرف على الكلام لهذه الطريقة على إشارات الكلام في البيئات الصاخبة في العالم الحقيقي. توضح النتائج التجريبية أن الطريقة تفوقت على طرق استخراج الميزة الكلاسيكية من حيث معدل التعرف على الكلام. يتم استخدام نظام التعرف على الكلام القائم على نماذج ماركوف المخفية المستخدمة على منصة HTK 3.4.1 (مجموعة أدوات نموذج ماركوف المخفية).

Translated Description (French)

L'article présente une méthode d'extraction de caractéristiques, appelée Normalized Gammachirp Cepstral Coefficients (NGCC) qui incorpore les propriétés du système auditif périphérique pour améliorer la robustesse de la reconnaissance vocale bruyante. La méthode proposée est basée sur un filtre passe-bas du deuxième ordre et un banc de filtres gammachirp normalisé pour émuler les mécanismes exécutés dans l'oreille externe/moyenne et la cochlée. Les performances de reconnaissance vocale de cette méthode sont menées sur les signaux vocaux dans des environnements bruyants du monde réel. Les résultats expérimentaux démontrent que la méthode a surpassé les méthodes classiques d'extraction de caractéristiques en termes de taux de reconnaissance vocale. Le système de reconnaissance vocale basé sur les modèles de Markov cachés utilisé est utilisé sur la plate-forme HTK 3.4.1 (Hidden Markov Model Toolkit).

Translated Description (Spanish)

El documento presenta un método de extracción de características, denominado Coeficientes Cepstrales de Gammachirp Normalizados (NGCC) que incorpora las propiedades del sistema auditivo periférico para mejorar la robustez en el reconocimiento de voz ruidoso. El método propuesto se basa en un filtro de paso bajo de segundo orden y un banco de filtros de gammachirp normalizado para emular los mecanismos realizados en el oído externo/medio y la cóclea. El rendimiento del reconocimiento de voz de este método se lleva a cabo en las señales de voz en entornos ruidosos del mundo real. Los resultados experimentales demuestran que el método superó a los métodos clásicos de extracción de características en términos de tasa de reconocimiento de voz. El sistema de reconocimiento de voz basado en modelos ocultos de Markov utilizado se emplea en la plataforma HTK 3.4.1 (Hidden Markov Model Toolkit).

Files

jcssp.2016.56.61.pdf.pdf

Files (237.7 kB)

Please wait a few minutes before your translated files are ready Note: Some files might be protected thus translations might not work.

Name	Size	Download all
jcssp.2016.56.61.pdf.pdf md5:073508c3f9fce67a46a41aeead9b89ed	237.7 kB	Preview Download

Additional details

Translated title (Arabic): طريقة استخراج الميزة لتحسين التعرف على الكلام في البيئات الصاخبة
Translated title (French): Méthode d'extraction de caractéristiques pour améliorer la reconnaissance vocale dans les environnements bruyants
Translated title (Spanish): Método de extracción de funciones para mejorar el reconocimiento de voz en entornos ruidosos

Other: https://openalex.org/W2310360015
DOI: 10.3844/jcssp.2016.56.61

Is Global South Knowledge: Yes
Country: Tunisia

https://openalex.org/W1967789223
https://openalex.org/W1987292616
https://openalex.org/W1989164285
https://openalex.org/W2033708670
https://openalex.org/W2050758723
https://openalex.org/W2090861223
https://openalex.org/W2102834435
https://openalex.org/W2111042635
https://openalex.org/W2148154194
https://openalex.org/W2157184970
https://openalex.org/W2161025448
https://openalex.org/W285519105

	All versions	This version
Views	1	1
Downloads	1	1
Data volume	237.7 kB	237.7 kB

Feature Extraction Method for Improving Speech Recognition in Noisy Environments

Translated Descriptions

Translated Description (Arabic)

Translated Description (French)

Translated Description (Spanish)

Files

jcssp.2016.56.61.pdf.pdf

Files (237.7 kB)

Additional details

Additional titles

Identifiers

Related works

GreSIS Basics Section

References

Feature Extraction Method for Improving Speech Recognition in Noisy Environments

Creators

Description

Translated Descriptions

Translated Description (Arabic)

Translated Description (French)

Translated Description (Spanish)

Files

jcssp.2016.56.61.pdf.pdf

Files (237.7 kB)

Additional details

Additional titles

Identifiers

Related works

GreSIS Basics Section

References