Published November 11, 2021 | Version v1
Publication Open

Stepwise Covariance-Free Common Principal Components (CF-CPC) With an Application to Neuroscience

  • 1. University of Electronic Science and Technology of China
  • 2. Cuban Neuroscience Center

Description

Finding the common principal component (CPC) for ultra-high dimensional data is a multivariate technique used to discover the latent structure of covariance matrices of shared variables measured in two or more k conditions. Common eigenvectors are assumed for the covariance matrix of all conditions, only the eigenvalues being specific to each condition. Stepwise CPC computes a limited number of these CPCs, as the name indicates, sequentially and is, therefore, less time-consuming. This method becomes unfeasible when the number of variables p is ultra-high since storing k covariance matrices requires O(kp2) memory. Many dimensionality reduction algorithms have been improved to avoid explicit covariance calculation and storage (covariance-free). Here we propose a covariance-free stepwise CPC, which only requires O(kn) memory, where n is the total number of examples. Thus for n < < p, the new algorithm shows apparent advantages. It computes components quickly, with low consumption of machine resources. We validate our method CFCPC with the classical Iris data. We then show that CFCPC allows extracting the shared anatomical structure of EEG and MEG source spectra across a frequency range of 0.01-40 Hz.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يعد العثور على المكون الرئيسي المشترك (CPC) للبيانات فائقة الأبعاد تقنية متعددة المتغيرات تستخدم لاكتشاف البنية الكامنة لمصفوفات التباين المشترك للمتغيرات المشتركة المقاسة في حالتين أو أكثر من k. يتم افتراض المتجهات الذاتية الشائعة لمصفوفة التباين المشترك لجميع الحالات، فقط القيم الذاتية الخاصة بكل حالة. تحسب تكلفة النقرة بالتدريج عددًا محدودًا من تكلفة النقرة هذه، كما يشير الاسم، بالتتابع، وبالتالي فهي أقل استهلاكا للوقت. تصبح هذه الطريقة غير مجدية عندما يكون عدد المتغيرات p مرتفعًا للغاية نظرًا لأن تخزين مصفوفات التباين k يتطلب ذاكرة O(kp2). تم تحسين العديد من خوارزميات تقليل الأبعاد لتجنب حساب التباين المشترك الصريح والتخزين (الخالي من التباين). نقترح هنا تكلفة النقرة التدريجية الخالية من التباين، والتي لا تتطلب سوى ذاكرة O(kn)، حيث n هو العدد الإجمالي للأمثلة. وبالتالي بالنسبة لـ n << p، تُظهر الخوارزمية الجديدة مزايا واضحة. يحسب المكونات بسرعة، مع انخفاض استهلاك موارد الماكينة. نحن نتحقق من صحة طريقتنا CFCPC باستخدام بيانات IRIS الكلاسيكية. ثم نوضح أن CFCPC يسمح باستخراج البنية التشريحية المشتركة لأطياف مصدر EEG و MEG عبر نطاق تردد يتراوح بين 0.01-40 هرتز.

Translated Description (French)

La recherche de la composante principale commune (CPC) pour les données ultra-haute dimension est une technique multivariée utilisée pour découvrir la structure latente des matrices de covariance des variables partagées mesurées dans deux conditions k ou plus. Des vecteurs propres communs sont supposés pour la matrice de covariance de toutes les conditions, seules les valeurs propres étant spécifiques à chaque condition. Stepwise CPC calcule un nombre limité de ces CPC, comme leur nom l'indique, de manière séquentielle et prend donc moins de temps. Cette méthode devient irréalisable lorsque le nombre de variables p est ultra élevé puisque le stockage de k matrices de covariance nécessite O(kp2) mémoire. De nombreux algorithmes de réduction de la dimensionnalité ont été améliorés pour éviter le calcul et le stockage explicites de la covariance (sans covariance). Nous proposons ici un CPC pas à pas sans covariance, qui ne nécessite que de la mémoire O(kn), où n est le nombre total d'exemples. Ainsi pour n < < p, le nouvel algorithme présente des avantages apparents. Il calcule les composants rapidement, avec une faible consommation de ressources machine. Nous validons notre méthode CFCPC avec les données iris classiques. Nous montrons ensuite que le CFCPC permet d'extraire la structure anatomique partagée des spectres des sources EEG et MEG dans une gamme de fréquences de 0,01à 40 Hz.

Translated Description (Spanish)

Encontrar el componente principal común (CPC) para datos de dimensiones ultraaltas es una técnica multivariante utilizada para descubrir la estructura latente de las matrices de covarianza de variables compartidas medidas en dos o más condiciones k. Los vectores propios comunes se asumen para la matriz de covarianza de todas las condiciones, siendo solo los valores propios específicos de cada condición. El CPC escalonado calcula un número limitado de estos CPC, como su nombre indica, secuencialmente y, por lo tanto, consume menos tiempo. Este método se vuelve inviable cuando el número de variables p es ultra alto, ya que el almacenamiento de matrices de covarianza k requiere memoria O(kp2). Muchos algoritmos de reducción de la dimensionalidad se han mejorado para evitar el cálculo y almacenamiento explícito de la covarianza (sin covarianza). Aquí proponemos un CPC escalonado sin covarianza, que solo requiere memoria O(kn), donde n es el número total de ejemplos. Por lo tanto, para n < < p, el nuevo algoritmo muestra ventajas aparentes. Calcula los componentes rápidamente, con un bajo consumo de recursos de la máquina. Validamos nuestro método CFCPC con los datos clásicos del iris. A continuación, mostramos que el CFCPC permite extraer la estructura anatómica compartida de los espectros de la fuente de EEG y MEG en un rango de frecuencia de 0.01-40 Hz.

Files

pdf.pdf

Files (1.2 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:380c01279e4285dccef32ef2ade9b88f
1.2 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
المكونات الرئيسية المشتركة الخالية من التباين التدريجي (CF - CPC) مع التطبيق على علم الأعصاب
Translated title (French)
Composants principaux communs sans covariance par étapes (CF-CPC) avec une application aux neurosciences
Translated title (Spanish)
Componentes principales comunes sin covarianza (CF-CPC) paso a paso con una aplicación a la neurociencia

Identifiers

Other
https://openalex.org/W3211772706
DOI
10.3389/fnins.2021.750290

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Cuba

References

  • https://openalex.org/W173461569
  • https://openalex.org/W1859378381
  • https://openalex.org/W1989295597
  • https://openalex.org/W1995261664
  • https://openalex.org/W2001619934
  • https://openalex.org/W2039514112
  • https://openalex.org/W2077628004
  • https://openalex.org/W2084876298
  • https://openalex.org/W2087618423
  • https://openalex.org/W2098502158
  • https://openalex.org/W2110154587
  • https://openalex.org/W2140277878
  • https://openalex.org/W2141681031
  • https://openalex.org/W2164454882
  • https://openalex.org/W2197695076
  • https://openalex.org/W2334461006
  • https://openalex.org/W2566450482
  • https://openalex.org/W2945949212
  • https://openalex.org/W2970397635
  • https://openalex.org/W3027639633
  • https://openalex.org/W3096796777
  • https://openalex.org/W3099514962
  • https://openalex.org/W3103139989
  • https://openalex.org/W3118929121
  • https://openalex.org/W3126221909
  • https://openalex.org/W3128042879
  • https://openalex.org/W3164335724
  • https://openalex.org/W3196298141
  • https://openalex.org/W3199648511
  • https://openalex.org/W4229706427
  • https://openalex.org/W4239362545
  • https://openalex.org/W4246991615
  • https://openalex.org/W895842793