Hybrid Source Prior Based Independent Vector Analysis for Blind Separation of Speech Signals
- 1. University of Engineering and Technology Peshawar
- 2. King Abdulaziz University
Description
Blind Source Separation (BSS) application is a delinquent issue in a complex reverberant environment with changing room geometric dimensions and an increasing number of speech sources. The BSS application issue is determined by the independent component analysis that usually manipulates higher-order statistical approaches. However, the permutation between desired speech sources remains a challenging issue for BSS applications. The permutation problem is been rectified by Independent Vector Analysis (IVA) for BSS applications in the frequency domain. The performance dependency of the IVA approach solely relies on the selection of appropriate source-prior to preserve the inter-frequency dependencies between the same speech source amongst different frequency bins. Therefore, a hybrid model for the IVA method is presented, which comprises of multivariate generalized Gaussian and super-Gaussian distribution source priors to model low as well as high amplitudes speech signals. The weights of the hybrid model between multivariate Gaussian and generalized Gaussian are assigned in accordance to the energy of the observed non-stationary speech mixture signal. In the simulations, different speech mixtures are generated from various speech sources by simulated room model. The proposed approach evaluates the blind separation performance in terms of signal-to-distortion ratio (SDR) and is compared with well-known BSS methods. The results show an improvement of the proposed methodology for non-stationary speech signals over the state-of-the-art IVA models having a fixed source prior.
Translated Descriptions
Translated Description (Arabic)
تطبيق فصل المصدر الأعمى (BSS) هو مشكلة متأخرة في بيئة صدى معقدة ذات أبعاد هندسية لغرفة التغيير وعدد متزايد من مصادر الكلام. يتم تحديد مشكلة تطبيق BSS من خلال تحليل المكونات المستقل الذي يتعامل عادةً مع الأساليب الإحصائية العليا. ومع ذلك، لا يزال التبديل بين مصادر الكلام المطلوبة يمثل مشكلة صعبة لتطبيقات BSS. يتم تصحيح مشكلة التبديل من خلال تحليل المتجهات المستقل (IVA) لتطبيقات BSS في مجال التردد. تعتمد تبعية الأداء لنهج IVA فقط على اختيار المصدر المناسب - قبل الحفاظ على التبعيات بين الترددات بين نفس مصدر الكلام بين صناديق التردد المختلفة. لذلك، يتم تقديم نموذج هجين لطريقة IVA، والذي يتكون من مسبقات مصدر التوزيع الغاوسية والفائقة الغاوسية المعممة متعددة المتغيرات لنمذجة إشارات الكلام منخفضة السعة وعالية السعة. يتم تعيين أوزان النموذج الهجين بين الغاوسية متعددة المتغيرات والغاوسية المعممة وفقًا لطاقة إشارة خليط الكلام غير الثابتة المرصودة. في عمليات المحاكاة، يتم إنشاء مخاليط الكلام المختلفة من مصادر الكلام المختلفة بواسطة نموذج غرفة المحاكاة. يقيم النهج المقترح أداء الفصل الأعمى من حيث نسبة الإشارة إلى التشويه (SDR) ويتم مقارنته بطرق BSS المعروفة. تظهر النتائج تحسنًا في المنهجية المقترحة لإشارات الكلام غير الثابتة مقارنة بنماذج IVA الحديثة التي لها مصدر ثابت سابق.Translated Description (French)
L'application Blind Source Separation (BSS) est un problème délinquant dans un environnement réverbérant complexe avec des dimensions géométriques de vestiaire et un nombre croissant de sources vocales. Le problème de l'application BSS est déterminé par l'analyse des composants indépendants qui manipule généralement des approches statistiques d'ordre supérieur. Cependant, la permutation entre les sources vocales souhaitées reste un problème difficile pour les applications BSS. Le problème de permutation est corrigé par une analyse vectorielle indépendante (IVA) pour les applications BSS dans le domaine fréquentiel. La dépendance de la performance de l'approche IVA repose uniquement sur la sélection de la source prioritaire appropriée pour préserver les dépendances inter-fréquences entre la même source vocale parmi différentes tranches de fréquence. Par conséquent, un modèle hybride pour la méthode IVA est présenté, qui comprend des sources de distribution gaussienne et super gaussienne généralisées multivariées pour modéliser des signaux vocaux de faibles et de fortes amplitudes. Les poids du modèle hybride entre la gaussienne multivariée et la gaussienne généralisée sont attribués en fonction de l'énergie du signal de mélange de parole non stationnaire observé. Dans les simulations, différents mélanges vocaux sont générés à partir de diverses sources vocales par un modèle de pièce simulée. L'approche proposée évalue les performances de séparation aveugle en termes de rapport signal sur distorsion (SDR) et est comparée aux méthodes BSS bien connues. Les résultats montrent une amélioration de la méthodologie proposée pour les signaux vocaux non stationnaires par rapport aux modèles IVA de pointe ayant une source fixe avant.Translated Description (Spanish)
La aplicación de separación de fuentes ciegas (BSS) es un problema delictivo en un entorno reverberante complejo con dimensiones geométricas cambiantes y un número creciente de fuentes de voz. El problema de la aplicación de BSS está determinado por el análisis de componentes independientes que generalmente manipula enfoques estadísticos de orden superior. Sin embargo, la permutación entre las fuentes de voz deseadas sigue siendo un problema difícil para las aplicaciones de BSS. El problema de permutación se rectifica mediante el Análisis Vectorial Independiente (IVA) para aplicaciones de BSS en el dominio de la frecuencia. La dependencia del rendimiento del enfoque IVA se basa únicamente en la selección de la fuente apropiada, antes de preservar las dependencias interfrecuencia entre la misma fuente de voz entre diferentes contenedores de frecuencia. Por lo tanto, se presenta un modelo híbrido para el método IVA, que comprende fuentes de distribución gaussianas y supergaussianas generalizadas multivariantes previas al modelo de señales de voz de amplitud baja y alta. Los pesos del modelo híbrido entre el gaussiano multivariante y el gaussiano generalizado se asignan de acuerdo con la energía de la señal de mezcla de habla no estacionaria observada. En las simulaciones, se generan diferentes mezclas de voz a partir de varias fuentes de voz mediante el modelo de sala simulada. El enfoque propuesto evalúa el rendimiento de separación ciega en términos de relación señal-distorsión (SDR) y se compara con métodos de BSS bien conocidos. Los resultados muestran una mejora de la metodología propuesta para señales de habla no estacionarias sobre los modelos IVA de última generación que tienen una fuente fija previa.Files
09144187.pdf.pdf
Files
(245 Bytes)
Name | Size | Download all |
---|---|---|
md5:ecd7d01261a3347cededc23c30a3ab1f
|
245 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- تحليل المتجهات المستقل القائم على المصدر الهجين للفصل الأعمى لإشارات الكلام
- Translated title (French)
- Source hybride Analyse vectorielle indépendante basée sur les antécédents pour la séparation aveugle des signaux vocaux
- Translated title (Spanish)
- Análisis vectorial independiente basado en la fuente híbrida previa para la separación ciega de señales de voz
Identifiers
- Other
- https://openalex.org/W3044124250
- DOI
- 10.1109/access.2020.3010342
References
- https://openalex.org/W2002970502
- https://openalex.org/W2013653677
- https://openalex.org/W2055637322
- https://openalex.org/W2102423079
- https://openalex.org/W2108325737
- https://openalex.org/W2117678320
- https://openalex.org/W2123649031
- https://openalex.org/W2133069808
- https://openalex.org/W2143169494
- https://openalex.org/W2149942017
- https://openalex.org/W2170768669
- https://openalex.org/W2205898128
- https://openalex.org/W2294321532
- https://openalex.org/W2402337759
- https://openalex.org/W2486584782
- https://openalex.org/W2545478040
- https://openalex.org/W2565423119
- https://openalex.org/W2582178485
- https://openalex.org/W2743121184
- https://openalex.org/W2775997803
- https://openalex.org/W2792924912
- https://openalex.org/W2906740242
- https://openalex.org/W2963375116
- https://openalex.org/W2969889150
- https://openalex.org/W2972136298
- https://openalex.org/W3105271931
- https://openalex.org/W3127686677
- https://openalex.org/W3205392798
- https://openalex.org/W3211296858
- https://openalex.org/W6639174
- https://openalex.org/W76597279