Published July 21, 2020 | Version v1
Publication Open

Strategy for improved characterization of human metabolic phenotypes using a COmbined Multi-block Principal components Analysis with Statistical Spectroscopy (COMPASS)

  • 1. Murdoch University
  • 2. MRC Biostatistics Unit
  • 3. Imperial College London
  • 4. Umeå University
  • 5. Northwestern University
  • 6. Universidad del Valle

Description

Abstract Motivation Large-scale population omics data can provide insight into associations between gene–environment interactions and disease. However, existing dimension reduction modelling techniques are often inefficient for extracting detailed information from these complex datasets. Results Here, we present an interactive software pipeline for exploratory analyses of population-based nuclear magnetic resonance spectral data using a COmbined Multi-block Principal components Analysis with Statistical Spectroscopy (COMPASS) within the R-library hastaLaVista framework. Principal component analysis models are generated for a sequential series of spectral regions (blocks) to provide more granular detail defining sub-populations within the dataset. Molecular identification of key differentiating signals is subsequently achieved by implementing Statistical TOtal Correlation SpectroscopY on the full spectral data to define feature patterns. Finally, the distributions of cross-correlation of the reference patterns across the spectral dataset are used to provide population statistics for identifying underlying features arising from drug intake, latent diseases and diet. The COMPASS method thus provides an efficient semi-automated approach for screening population datasets. Availability and implementation Source code is available at https://github.com/cheminfo/COMPASS. Supplementary information Supplementary data are available at Bioinformatics online.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

التحفيز التجريدي يمكن أن توفر بيانات أوميكس السكانية واسعة النطاق نظرة ثاقبة على الارتباطات بين تفاعلات الجينات والبيئة والمرض. ومع ذلك، غالبًا ما تكون تقنيات نمذجة تقليل الأبعاد الحالية غير فعالة لاستخراج معلومات مفصلة من مجموعات البيانات المعقدة هذه. النتائج هنا، نقدم خط أنابيب برنامج تفاعلي للتحليلات الاستكشافية للبيانات الطيفية للرنين المغناطيسي النووي القائم على السكان باستخدام تحليل المكونات الرئيسية متعددة الكتل المدمجة مع التحليل الطيفي الإحصائي (COMPASS) ضمن إطار R - library hastaLaVista. يتم إنشاء نماذج تحليل المكونات الرئيسية لسلسلة متسلسلة من المناطق الطيفية (الكتل) لتوفير المزيد من التفاصيل الدقيقة التي تحدد المجموعات السكانية الفرعية داخل مجموعة البيانات. يتم تحقيق التحديد الجزيئي لإشارات التمايز الرئيسية لاحقًا من خلال تنفيذ التحليل الطيفي للارتباط الكلي الإحصائي على البيانات الطيفية الكاملة لتحديد أنماط السمات. وأخيرًا، تُستخدم توزيعات الارتباط المتبادل للأنماط المرجعية عبر مجموعة البيانات الطيفية لتوفير إحصاءات سكانية لتحديد السمات الأساسية الناشئة عن تناول الأدوية والأمراض الكامنة والنظام الغذائي. وبالتالي، توفر طريقة البوصلة نهجًا شبه آلي فعال لفحص مجموعات البيانات السكانية. التوفر والتنفيذ رمز المصدر متاح على https://github.com/cheminfo/COMPASS. معلومات تكميلية البيانات التكميلية متاحة في المعلوماتية الحيوية عبر الإنترنت.

Translated Description (French)

Motivation abstraite Les données omiques de population à grande échelle peuvent fournir un aperçu des associations entre les interactions gène-environnement et la maladie. Cependant, les techniques existantes de modélisation de la réduction des dimensions sont souvent inefficaces pour extraire des informations détaillées de ces ensembles de données complexes. Résultats Ici, nous présentons un pipeline logiciel interactif pour les analyses exploratoires de données spectrales de résonance magnétique nucléaire basées sur la population à l'aide d'une analyse en composantes principales multiblocs COmbined avec spectroscopie statistique (COMPASS) dans le cadre de la R-bibliothèque hastaLaVista. Des modèles d'analyse en composantes principales sont générés pour une série séquentielle de régions spectrales (blocs) afin de fournir des détails plus granulaires définissant des sous-populations dans l'ensemble de données. L'identification moléculaire des signaux de différenciation clés est ensuite réalisée en mettant en œuvre la spectroscopie de corrélation TOtal statistique sur les données spectrales complètes pour définir les modèles de caractéristiques. Enfin, les distributions de corrélation croisée des modèles de référence à travers l'ensemble de données spectrales sont utilisées pour fournir des statistiques de population permettant d'identifier les caractéristiques sous-jacentes découlant de la consommation de médicaments, des maladies latentes et du régime alimentaire. La méthode COMPASS fournit ainsi une approche semi-automatisée efficace pour le criblage d'ensembles de données de population. Disponibilité et implémentation Le code source est disponible sur https://github.com/cheminfo/COMPASS. Informations supplémentaires Des données supplémentaires sont disponibles en ligne sur Bioinformatics.

Translated Description (Spanish)

Resumen Motivación Los datos ómicos de población a gran escala pueden proporcionar información sobre las asociaciones entre las interacciones gen-ambiente y la enfermedad. Sin embargo, las técnicas de modelado de reducción de dimensiones existentes a menudo son ineficientes para extraer información detallada de estos conjuntos de datos complejos. Resultados Aquí, presentamos un canal de software interactivo para análisis exploratorios de datos espectrales de resonancia magnética nuclear basados en la población utilizando un Análisis de componentes principales de múltiples bloques combinados con espectroscopia estadística (COMPASS) dentro del marco hastaLaVista de la biblioteca R. Los modelos de análisis de componentes principales se generan para una serie secuencial de regiones espectrales (bloques) para proporcionar detalles más granulares que definen subpoblaciones dentro del conjunto de datos. La identificación molecular de las señales diferenciadoras clave se logra posteriormente mediante la implementación de la Espectroscopía de Correlación Total Estadística en los datos espectrales completos para definir patrones de características. Por último, las distribuciones de la correlación cruzada de los patrones de referencia a través del conjunto de datos espectrales se utilizan para proporcionar estadísticas de población para identificar las características subyacentes derivadas de la ingesta de fármacos, las enfermedades latentes y la dieta. Por lo tanto, el método COMPASS proporciona un enfoque semiautomático eficiente para el cribado de conjuntos de datos de población. Disponibilidad e implementación El código fuente está disponible en https://github.com/cheminfo/COMPASS. Información complementaria Los datos complementarios están disponibles en Bioinformática en línea.

Files

btaa649.pdf.pdf

Files (93 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:b0d506893d4802090edf1644f5f082cd
93 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
استراتيجية لتحسين توصيف الأنماط الظاهرية الأيضية البشرية باستخدام تحليل المكونات الرئيسية المجمعة متعددة الكتل مع التحليل الطيفي الإحصائي (البوصلة)
Translated title (French)
Stratégie pour une meilleure caractérisation des phénotypes métaboliques humains à l'aide d'une analyse des composantes principales multiblocs COmbined avec spectroscopie statistique (COMPASS)
Translated title (Spanish)
Estrategia para una mejor caracterización de los fenotipos metabólicos humanos utilizando un análisis combinado de componentes principales de múltiples bloques con espectroscopia estadística (COMPASS)

Identifiers

Other
https://openalex.org/W3044653271
DOI
10.1093/bioinformatics/btaa649

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Colombia

References

  • https://openalex.org/W2013036395
  • https://openalex.org/W2013607204
  • https://openalex.org/W2015168397
  • https://openalex.org/W2018888813
  • https://openalex.org/W2047346998
  • https://openalex.org/W2071813447
  • https://openalex.org/W2073039202
  • https://openalex.org/W2073503722
  • https://openalex.org/W2083637865
  • https://openalex.org/W2089468765
  • https://openalex.org/W2089996359
  • https://openalex.org/W2091585999
  • https://openalex.org/W2101787747
  • https://openalex.org/W2111074526
  • https://openalex.org/W2120929142
  • https://openalex.org/W2134364540
  • https://openalex.org/W2144956608
  • https://openalex.org/W2152483944
  • https://openalex.org/W2185920390
  • https://openalex.org/W2503993098
  • https://openalex.org/W2775218904
  • https://openalex.org/W2993316704
  • https://openalex.org/W36814200