Strategy for improved characterization of human metabolic phenotypes using a COmbined Multi-block Principal components Analysis with Statistical Spectroscopy (COMPASS)
Creators
- 1. Murdoch University
- 2. MRC Biostatistics Unit
- 3. Imperial College London
- 4. Umeå University
- 5. Northwestern University
- 6. Universidad del Valle
Description
Abstract Motivation Large-scale population omics data can provide insight into associations between gene–environment interactions and disease. However, existing dimension reduction modelling techniques are often inefficient for extracting detailed information from these complex datasets. Results Here, we present an interactive software pipeline for exploratory analyses of population-based nuclear magnetic resonance spectral data using a COmbined Multi-block Principal components Analysis with Statistical Spectroscopy (COMPASS) within the R-library hastaLaVista framework. Principal component analysis models are generated for a sequential series of spectral regions (blocks) to provide more granular detail defining sub-populations within the dataset. Molecular identification of key differentiating signals is subsequently achieved by implementing Statistical TOtal Correlation SpectroscopY on the full spectral data to define feature patterns. Finally, the distributions of cross-correlation of the reference patterns across the spectral dataset are used to provide population statistics for identifying underlying features arising from drug intake, latent diseases and diet. The COMPASS method thus provides an efficient semi-automated approach for screening population datasets. Availability and implementation Source code is available at https://github.com/cheminfo/COMPASS. Supplementary information Supplementary data are available at Bioinformatics online.
Translated Descriptions
Translated Description (Arabic)
التحفيز التجريدي يمكن أن توفر بيانات أوميكس السكانية واسعة النطاق نظرة ثاقبة على الارتباطات بين تفاعلات الجينات والبيئة والمرض. ومع ذلك، غالبًا ما تكون تقنيات نمذجة تقليل الأبعاد الحالية غير فعالة لاستخراج معلومات مفصلة من مجموعات البيانات المعقدة هذه. النتائج هنا، نقدم خط أنابيب برنامج تفاعلي للتحليلات الاستكشافية للبيانات الطيفية للرنين المغناطيسي النووي القائم على السكان باستخدام تحليل المكونات الرئيسية متعددة الكتل المدمجة مع التحليل الطيفي الإحصائي (COMPASS) ضمن إطار R - library hastaLaVista. يتم إنشاء نماذج تحليل المكونات الرئيسية لسلسلة متسلسلة من المناطق الطيفية (الكتل) لتوفير المزيد من التفاصيل الدقيقة التي تحدد المجموعات السكانية الفرعية داخل مجموعة البيانات. يتم تحقيق التحديد الجزيئي لإشارات التمايز الرئيسية لاحقًا من خلال تنفيذ التحليل الطيفي للارتباط الكلي الإحصائي على البيانات الطيفية الكاملة لتحديد أنماط السمات. وأخيرًا، تُستخدم توزيعات الارتباط المتبادل للأنماط المرجعية عبر مجموعة البيانات الطيفية لتوفير إحصاءات سكانية لتحديد السمات الأساسية الناشئة عن تناول الأدوية والأمراض الكامنة والنظام الغذائي. وبالتالي، توفر طريقة البوصلة نهجًا شبه آلي فعال لفحص مجموعات البيانات السكانية. التوفر والتنفيذ رمز المصدر متاح على https://github.com/cheminfo/COMPASS. معلومات تكميلية البيانات التكميلية متاحة في المعلوماتية الحيوية عبر الإنترنت.Translated Description (French)
Motivation abstraite Les données omiques de population à grande échelle peuvent fournir un aperçu des associations entre les interactions gène-environnement et la maladie. Cependant, les techniques existantes de modélisation de la réduction des dimensions sont souvent inefficaces pour extraire des informations détaillées de ces ensembles de données complexes. Résultats Ici, nous présentons un pipeline logiciel interactif pour les analyses exploratoires de données spectrales de résonance magnétique nucléaire basées sur la population à l'aide d'une analyse en composantes principales multiblocs COmbined avec spectroscopie statistique (COMPASS) dans le cadre de la R-bibliothèque hastaLaVista. Des modèles d'analyse en composantes principales sont générés pour une série séquentielle de régions spectrales (blocs) afin de fournir des détails plus granulaires définissant des sous-populations dans l'ensemble de données. L'identification moléculaire des signaux de différenciation clés est ensuite réalisée en mettant en œuvre la spectroscopie de corrélation TOtal statistique sur les données spectrales complètes pour définir les modèles de caractéristiques. Enfin, les distributions de corrélation croisée des modèles de référence à travers l'ensemble de données spectrales sont utilisées pour fournir des statistiques de population permettant d'identifier les caractéristiques sous-jacentes découlant de la consommation de médicaments, des maladies latentes et du régime alimentaire. La méthode COMPASS fournit ainsi une approche semi-automatisée efficace pour le criblage d'ensembles de données de population. Disponibilité et implémentation Le code source est disponible sur https://github.com/cheminfo/COMPASS. Informations supplémentaires Des données supplémentaires sont disponibles en ligne sur Bioinformatics.Translated Description (Spanish)
Resumen Motivación Los datos ómicos de población a gran escala pueden proporcionar información sobre las asociaciones entre las interacciones gen-ambiente y la enfermedad. Sin embargo, las técnicas de modelado de reducción de dimensiones existentes a menudo son ineficientes para extraer información detallada de estos conjuntos de datos complejos. Resultados Aquí, presentamos un canal de software interactivo para análisis exploratorios de datos espectrales de resonancia magnética nuclear basados en la población utilizando un Análisis de componentes principales de múltiples bloques combinados con espectroscopia estadística (COMPASS) dentro del marco hastaLaVista de la biblioteca R. Los modelos de análisis de componentes principales se generan para una serie secuencial de regiones espectrales (bloques) para proporcionar detalles más granulares que definen subpoblaciones dentro del conjunto de datos. La identificación molecular de las señales diferenciadoras clave se logra posteriormente mediante la implementación de la Espectroscopía de Correlación Total Estadística en los datos espectrales completos para definir patrones de características. Por último, las distribuciones de la correlación cruzada de los patrones de referencia a través del conjunto de datos espectrales se utilizan para proporcionar estadísticas de población para identificar las características subyacentes derivadas de la ingesta de fármacos, las enfermedades latentes y la dieta. Por lo tanto, el método COMPASS proporciona un enfoque semiautomático eficiente para el cribado de conjuntos de datos de población. Disponibilidad e implementación El código fuente está disponible en https://github.com/cheminfo/COMPASS. Información complementaria Los datos complementarios están disponibles en Bioinformática en línea.Files
btaa649.pdf.pdf
Files
(93 Bytes)
| Name | Size | Download all |
|---|---|---|
|
md5:b0d506893d4802090edf1644f5f082cd
|
93 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- استراتيجية لتحسين توصيف الأنماط الظاهرية الأيضية البشرية باستخدام تحليل المكونات الرئيسية المجمعة متعددة الكتل مع التحليل الطيفي الإحصائي (البوصلة)
- Translated title (French)
- Stratégie pour une meilleure caractérisation des phénotypes métaboliques humains à l'aide d'une analyse des composantes principales multiblocs COmbined avec spectroscopie statistique (COMPASS)
- Translated title (Spanish)
- Estrategia para una mejor caracterización de los fenotipos metabólicos humanos utilizando un análisis combinado de componentes principales de múltiples bloques con espectroscopia estadística (COMPASS)
Identifiers
- Other
- https://openalex.org/W3044653271
- DOI
- 10.1093/bioinformatics/btaa649
References
- https://openalex.org/W2013036395
- https://openalex.org/W2013607204
- https://openalex.org/W2015168397
- https://openalex.org/W2018888813
- https://openalex.org/W2047346998
- https://openalex.org/W2071813447
- https://openalex.org/W2073039202
- https://openalex.org/W2073503722
- https://openalex.org/W2083637865
- https://openalex.org/W2089468765
- https://openalex.org/W2089996359
- https://openalex.org/W2091585999
- https://openalex.org/W2101787747
- https://openalex.org/W2111074526
- https://openalex.org/W2120929142
- https://openalex.org/W2134364540
- https://openalex.org/W2144956608
- https://openalex.org/W2152483944
- https://openalex.org/W2185920390
- https://openalex.org/W2503993098
- https://openalex.org/W2775218904
- https://openalex.org/W2993316704
- https://openalex.org/W36814200