A Novel Method for Cancer Subtyping and Risk Prediction Using Consensus Factor Analysis
- 1. University of Nevada Reno
- 2. Trường ĐH Nguyễn Tất Thành
- 3. University of Pittsburgh
- 4. University of Pittsburgh Medical Center
Description
Cancer is an umbrella term that includes a range of disorders, from those that are fast-growing and lethal to indolent lesions with low or delayed potential for progression to death. One critical unmet challenge is that molecular disease subtypes characterized by relevant clinical differences, such as survival, are difficult to differentiate. With the advancement of multi-omics technologies, subtyping methods have shifted toward data integration in order to differentiate among subtypes from a holistic perspective that takes into consideration phenomena at multiple levels. However, these integrative methods are still limited by their statistical assumption and their sensitivity to noise. In addition, they are unable to predict the risk scores of patients using multi-omics data. Here, we present a novel approach named Subtyping via Consensus Factor Analysis (SCFA) that can efficiently remove noisy signals from consistent molecular patterns in order to reliably identify cancer subtypes and accurately predict risk scores of patients. In an extensive analysis of 7,973 samples related to 30 cancers that are available at The Cancer Genome Atlas (TCGA), we demonstrate that SCFA outperforms state-of-the-art approaches in discovering novel subtypes with significantly different survival profiles. We also demonstrate that SCFA is able to predict risk scores that are highly correlated with true patient survival and vital status. More importantly, the accuracy of subtype discovery and risk prediction improves when more data types are integrated into the analysis. The SCFA software and TCGA data packages will be available on Bioconductor.
Translated Descriptions
Translated Description (Arabic)
السرطان هو مصطلح شامل يشمل مجموعة من الاضطرابات، من تلك التي تنمو بسرعة ومميتة إلى الآفات الكسولة ذات الإمكانية المنخفضة أو المتأخرة للتقدم حتى الموت. يتمثل أحد التحديات الحرجة التي لم يتم تلبيتها في صعوبة التمييز بين الأنواع الفرعية للأمراض الجزيئية التي تتميز بالاختلافات السريرية ذات الصلة، مثل البقاء على قيد الحياة. مع تقدم تقنيات علم الاقتصاد المتعدد، تحولت أساليب التصنيف الفرعي نحو تكامل البيانات من أجل التمييز بين الأنواع الفرعية من منظور شامل يأخذ في الاعتبار الظواهر على مستويات متعددة. ومع ذلك، لا تزال هذه الأساليب التكاملية محدودة بسبب افتراضها الإحصائي وحساسيتها للضوضاء. بالإضافة إلى ذلك، فهم غير قادرين على التنبؤ بدرجات المخاطر للمرضى الذين يستخدمون بيانات متعددة الأوميكس. هنا، نقدم نهجًا جديدًا يسمى التصنيف الفرعي عبر تحليل عامل الإجماع (SCFA) والذي يمكنه إزالة الإشارات الصاخبة بكفاءة من الأنماط الجزيئية المتسقة من أجل تحديد الأنواع الفرعية للسرطان بشكل موثوق والتنبؤ بدقة بعشرات المخاطر للمرضى. في تحليل شامل لـ 7973 عينة تتعلق بـ 30 نوعًا من السرطانات المتوفرة في أطلس جينوم السرطان (TCGA)، أظهرنا أن الهيئة العامة للإسكان والإسكان تتفوق على أحدث الأساليب في اكتشاف أنواع فرعية جديدة ذات ملامح بقاء مختلفة بشكل كبير. كما نثبت أن الهيئة العامة للإقامة وشؤون الأسرة قادرة على التنبؤ بدرجات المخاطر التي ترتبط ارتباطًا وثيقًا ببقاء المريض الحقيقي وحالته الحيوية. والأهم من ذلك، تتحسن دقة اكتشاف النوع الفرعي والتنبؤ بالمخاطر عندما يتم دمج المزيد من أنواع البيانات في التحليل. سيتوفر برنامج SCFA وحزم بيانات TCGA على Bioconductor.Translated Description (French)
Le cancer est un terme générique qui comprend une gamme de troubles, allant de ceux à croissance rapide et mortels aux lésions indolentes avec un potentiel de progression faible ou retardé vers la mort. Un défi critique non résolu est que les sous-types de maladies moléculaires caractérisés par des différences cliniques pertinentes, telles que la survie, sont difficiles à différencier. Avec l'avancement des technologies multi-omiques, les méthodes de sous-typage se sont déplacées vers l'intégration des données afin de différencier les sous-types dans une perspective holistique qui prend en compte les phénomènes à plusieurs niveaux. Cependant, ces méthodes intégratives sont encore limitées par leur hypothèse statistique et leur sensibilité au bruit. De plus, ils sont incapables de prédire les scores de risque des patients à l'aide de données multi-omiques. Ici, nous présentons une nouvelle approche nommée Subtyping via Consensus Factor Analysis (SCFA) qui peut éliminer efficacement les signaux bruyants des modèles moléculaires cohérents afin d'identifier de manière fiable les sous-types de cancer et de prédire avec précision les scores de risque des patients. Dans une analyse approfondie de 7 973 échantillons liés à 30 cancers disponibles à l'Atlas du génome du cancer (TCGA), nous démontrons que les AGCC surpassent les approches de pointe dans la découverte de nouveaux sous-types avec des profils de survie significativement différents. Nous démontrons également que les AGCC sont capables de prédire les scores de risque qui sont fortement corrélés à la survie réelle du patient et à son état vital. Plus important encore, la précision de la découverte des sous-types et de la prédiction des risques s'améliore lorsque davantage de types de données sont intégrés dans l'analyse. Le logiciel SCFA et les paquets de données TCGA seront disponibles sur Bioconductor.Translated Description (Spanish)
El cáncer es un término general que incluye una variedad de trastornos, desde aquellos de rápido crecimiento y letales hasta lesiones indolentes con un potencial bajo o retardado de progresión a la muerte. Un desafío crítico no resuelto es que los subtipos de enfermedades moleculares caracterizados por diferencias clínicas relevantes, como la supervivencia, son difíciles de diferenciar. Con el avance de las tecnologías multiómicas, los métodos de subtipificación se han desplazado hacia la integración de datos para diferenciar entre subtipos desde una perspectiva holística que tiene en cuenta los fenómenos en múltiples niveles. Sin embargo, estos métodos integradores aún están limitados por su suposición estadística y su sensibilidad al ruido. Además, no pueden predecir las puntuaciones de riesgo de los pacientes utilizando datos multiómicos. Aquí, presentamos un enfoque novedoso llamado Subtipificación a través del Análisis Factorial de Consenso (SCFA, por sus siglas en inglés) que puede eliminar de manera eficiente las señales ruidosas de patrones moleculares consistentes para identificar de manera confiable los subtipos de cáncer y predecir con precisión las puntuaciones de riesgo de los pacientes. En un extenso análisis de 7.973 muestras relacionadas con 30 cánceres que están disponibles en The Cancer Genome Atlas (TCGA), demostramos que los SCFA superan los enfoques más avanzados en el descubrimiento de nuevos subtipos con perfiles de supervivencia significativamente diferentes. También demostramos que SCFA es capaz de predecir puntajes de riesgo que están altamente correlacionados con la verdadera supervivencia del paciente y el estado vital. Más importante aún, la precisión del descubrimiento de subtipos y la predicción de riesgos mejora cuando se integran más tipos de datos en el análisis. El software SCFA y los paquetes de datos TCGA estarán disponibles en Bioconductor.Files
pdf.pdf
Files
(1.0 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:505543028ce0996b2d4a6c73e0ff7369
|
1.0 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- طريقة جديدة للنمط الفرعي للسرطان والتنبؤ بالمخاطر باستخدام تحليل عامل الإجماع
- Translated title (French)
- Une nouvelle méthode de sous-typage du cancer et de prédiction des risques à l'aide de l'analyse factorielle consensuelle
- Translated title (Spanish)
- Un nuevo método para la subtipificación del cáncer y la predicción del riesgo mediante el análisis de factores de consenso
Identifiers
- Other
- https://openalex.org/W3036271015
- DOI
- 10.3389/fonc.2020.01052
References
- https://openalex.org/W1548779692
- https://openalex.org/W1769049279
- https://openalex.org/W1886306325
- https://openalex.org/W1970957579
- https://openalex.org/W1987219048
- https://openalex.org/W1990517717
- https://openalex.org/W1999345637
- https://openalex.org/W2022401242
- https://openalex.org/W2023461603
- https://openalex.org/W2027486254
- https://openalex.org/W2044702943
- https://openalex.org/W2053822295
- https://openalex.org/W2069381074
- https://openalex.org/W2075900721
- https://openalex.org/W2075997152
- https://openalex.org/W2084139018
- https://openalex.org/W2092423825
- https://openalex.org/W2095763169
- https://openalex.org/W2101995865
- https://openalex.org/W2102976033
- https://openalex.org/W2105717378
- https://openalex.org/W2105860794
- https://openalex.org/W2109363337
- https://openalex.org/W2112668677
- https://openalex.org/W2114238186
- https://openalex.org/W2115462905
- https://openalex.org/W2115494288
- https://openalex.org/W2117968640
- https://openalex.org/W2122825543
- https://openalex.org/W2129034112
- https://openalex.org/W2132914434
- https://openalex.org/W2134539328
- https://openalex.org/W2135187880
- https://openalex.org/W2136097953
- https://openalex.org/W2136787567
- https://openalex.org/W2137540340
- https://openalex.org/W2139967559
- https://openalex.org/W2141012957
- https://openalex.org/W2141599838
- https://openalex.org/W2152012752
- https://openalex.org/W2157076315
- https://openalex.org/W2182482244
- https://openalex.org/W2185729964
- https://openalex.org/W2324805613
- https://openalex.org/W2510686307
- https://openalex.org/W2569086487
- https://openalex.org/W2611654275
- https://openalex.org/W2611831635
- https://openalex.org/W2618790874
- https://openalex.org/W2765654979
- https://openalex.org/W2783685429
- https://openalex.org/W2899212028
- https://openalex.org/W2906107882
- https://openalex.org/W2913268845
- https://openalex.org/W2950878899
- https://openalex.org/W2951033368
- https://openalex.org/W2980070874
- https://openalex.org/W3003444384
- https://openalex.org/W3130814454
- https://openalex.org/W3147894994
- https://openalex.org/W4236745633
- https://openalex.org/W4252676770
- https://openalex.org/W70383152