Speech Enhancement with Geometric Advent of Spectral Subtraction using Connected Time-Frequency Regions Noise Estimation
- 1. Ghulam Ishaq Khan Institute of Engineering Sciences and Technology
- 2. City University of Science and Information Technology
- 3. Kohat University of Science and Technology
- 4. COMSATS University Islamabad
Description
Speech enhancement with Geometric Advent of Spectral subtraction using connected time-frequency regions noise estimation aims to de-noise or reduce background noise from the noisy speech for better quality, pleasantness and improved intelligibility. Numerous enhancement methods are proposed including spectral subtraction, subspace, statistical with different noise estimations. The traditional spectral subtraction techniques are reasonably simple to implement and suffer from musical noise. This study addresses the new approach for speech enhancement which has minimized the insufficiencies in traditional spectral subtraction algorithms using MCRA. This approach with noise estimation has been evolved with PESQ, the ITU-T standard; Frequency weighted segmental SNR and weighted spectral slope. The analysis shows that Geometric approach with time-frequency connected regions has improved results than old-fashioned spectral subtraction algorithms. The normal hearing tests has suggested that new approach has lower audible musical noise.
Translated Descriptions
Translated Description (Arabic)
يهدف تحسين الكلام مع المجيء الهندسي للطرح الطيفي باستخدام تقدير ضوضاء مناطق التردد الزمني المتصلة إلى إزالة الضوضاء أو تقليل ضوضاء الخلفية من الكلام الصاخب للحصول على جودة أفضل ولطف ووضوح محسن. يتم اقتراح العديد من طرق التحسين بما في ذلك الطرح الطيفي والفضاء الفرعي والإحصائي مع تقديرات ضوضاء مختلفة. تقنيات الطرح الطيفي التقليدية سهلة التنفيذ بشكل معقول وتعاني من الضوضاء الموسيقية. تتناول هذه الدراسة النهج الجديد لتعزيز الكلام الذي قلل من أوجه القصور في خوارزميات الطرح الطيفي التقليدية باستخدام MCRA. تم تطوير هذا النهج مع تقدير الضوضاء مع PESQ، معيار ITU - T ؛ SNR القطعي المرجح بالتردد والمنحدر الطيفي المرجح. يوضح التحليل أن النهج الهندسي مع المناطق المتصلة بالتردد الزمني قد أدى إلى تحسين النتائج مقارنة بخوارزميات الطرح الطيفي القديمة. أشارت اختبارات السمع العادية إلى أن النهج الجديد يحتوي على ضوضاء موسيقية مسموعة أقل.Translated Description (French)
L'amélioration de la parole avec l'avènement géométrique de la soustraction spectrale à l'aide de l'estimation du bruit des régions temps-fréquence connectées vise à dé-bruiter ou à réduire le bruit de fond de la parole bruyante pour une meilleure qualité, agréable et intelligible. De nombreuses méthodes d'amélioration sont proposées, y compris la soustraction spectrale, le sous-espace, la statistique avec différentes estimations de bruit. Les techniques traditionnelles de soustraction spectrale sont raisonnablement simples à mettre en œuvre et souffrent de bruit musical. Cette étude aborde la nouvelle approche de l'amélioration de la parole qui a minimisé les insuffisances des algorithmes traditionnels de soustraction spectrale utilisant le MCRA. Cette approche avec estimation du bruit a été développée avec PESQ, la norme UIT-T ; RSB segmentaire pondéré en fréquence et pente spectrale pondérée. L'analyse montre que l'approche géométrique avec des régions connectées temps-fréquence a des résultats améliorés par rapport aux algorithmes de soustraction spectrale à l'ancienne. Les tests d'audition normaux ont suggéré que la nouvelle approche a un bruit musical audible plus faible.Translated Description (Spanish)
La mejora del habla con el advenimiento geométrico de la resta espectral utilizando la estimación de ruido de las regiones de tiempo-frecuencia conectadas tiene como objetivo eliminar el ruido o reducir el ruido de fondo del habla ruidosa para una mejor calidad, amabilidad y una mejor inteligibilidad. Se proponen numerosos métodos de mejora que incluyen sustracción espectral, subespacio, estadística con diferentes estimaciones de ruido. Las técnicas tradicionales de sustracción espectral son razonablemente simples de implementar y sufren de ruido musical. Este estudio aborda el nuevo enfoque para la mejora del habla que ha minimizado las insuficiencias en los algoritmos tradicionales de sustracción espectral utilizando MCRA. Este enfoque con estimación de ruido se ha desarrollado con PESQ, el estándar ITU-T; SNR segmental ponderada en frecuencia y pendiente espectral ponderada. El análisis muestra que el enfoque geométrico con regiones conectadas tiempo-frecuencia ha mejorado los resultados en comparación con los algoritmos de sustracción espectral anticuados. Las pruebas de audición normales han sugerido que el nuevo enfoque tiene un ruido musical audible más bajo.Files
6-1081-1087.pdf.pdf
Files
(226 Bytes)
Name | Size | Download all |
---|---|---|
md5:5360980bad11bf9723da89687501effc
|
226 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- تحسين الكلام مع ظهور هندسي للطرح الطيفي باستخدام تقدير الضوضاء لمناطق التردد الزمني المتصل
- Translated title (French)
- Amélioration de la parole avec l'avènement géométrique de la soustraction spectrale à l'aide de l'estimation du bruit des régions temps-fréquence connectées
- Translated title (Spanish)
- Mejora del habla con el advenimiento geométrico de la resta espectral utilizando la estimación de ruido de regiones de tiempo-frecuencia conectadas
Identifiers
- Other
- https://openalex.org/W2775798474
- DOI
- 10.19026/rjaset.6.4016
References
- https://openalex.org/W1495679096
- https://openalex.org/W1998648683
- https://openalex.org/W2103167563
- https://openalex.org/W2128653836
- https://openalex.org/W2131030892
- https://openalex.org/W2149535104
- https://openalex.org/W2158185319
- https://openalex.org/W2158336491
- https://openalex.org/W3145982341