Risk factors affecting patients survival with colorectal cancer in Morocco: survival analysis using an interpretable machine learning approach
Creators
- 1. Sidi Mohamed Ben Abdellah University
- 2. Université Mohammed VI des Sciences de la Santé
Description
Abstract The aim of our study was to assess the overall survival rates for colorectal cancer at 3 years and to identify associated strong prognostic factors among patients in Morocco through an interpretable machine learning approach. This approach is based on a fully non-parametric survival random forest (RSF), incorporating variable importance and partial dependence effects. The data was povided from a retrospective study of 343 patients diagnosed and followed at Hassan II University Hospital. Covariate selection was performed using the variable importance based on permutation and partial dependence plots were displayed to explore in depth the relationship between the estimated partial effect of a given predictor and survival rates. The predictive performance was measured by two metrics, the Concordance Index (C-index) and the Brier Score (BS). Overall survival rates at 1, 2 and 3 years were, respectively, 87% (SE = 0.02; CI-95% 0.84–0.91), 77% (SE = 0.02; CI-95% 0.73–0.82) and 60% (SE = 0.03; CI-95% 0.54–0.66). In the Cox model after adjustment for all covariates, sex, tumor differentiation had no significant effect on prognosis, but rather tumor site had a significant effect. The variable importance obtained from RSF strengthens that surgery, stage, insurance, residency, and age were the most important prognostic factors. The discriminative capacity of the Cox PH and RSF was, respectively, 0.771 and 0.798 for the C-index while the accuracy of the Cox PH and RSF was, respectively, 0.257 and 0.207 for the BS. This shows that RSF had both better discriminative capacity and predictive accuracy. Our results show that patients who are older than 70, living in rural areas, without health insurance, at a distant stage and who have not had surgery constitute a subgroup of patients with poor prognosis.
Translated Descriptions
Translated Description (Arabic)
كان الهدف من دراستنا هو تقييم معدلات البقاء على قيد الحياة الإجمالية لسرطان القولون والمستقيم في 3 سنوات وتحديد العوامل التنبؤية القوية المرتبطة به بين المرضى في المغرب من خلال نهج التعلم الآلي القابل للتفسير. يعتمد هذا النهج على غابة عشوائية للبقاء غير بارامترية بالكامل (RSF)، تتضمن أهمية متغيرة وتأثيرات تبعية جزئية. تم تقديم البيانات من دراسة بأثر رجعي لـ 343 مريضًا تم تشخيصهم ومتابعتهم في مستشفى الحسن الثاني الجامعي. تم إجراء اختيار المتغير التاجي باستخدام الأهمية المتغيرة بناءً على التبديل وتم عرض مخططات الاعتماد الجزئي لاستكشاف العلاقة بين التأثير الجزئي المقدر لمؤشر معين ومعدلات البقاء على قيد الحياة بعمق. تم قياس الأداء التنبؤي بمقياسين، مؤشر التوافق (C - index) ودرجة برير (BS). كانت معدلات البقاء على قيد الحياة الإجمالية عند 1 و 2 و 3 سنوات، على التوالي، 87 ٪ (SE = 0.02 ؛ CI -95 ٪ 0.84–0.91)، 77 ٪ (SE = 0.02 ؛ CI -95 ٪ 0.73–0.82) و 60 ٪ (SE = 0.03 ؛ CI -95 ٪ 0.54–0.66). في نموذج COX بعد التعديل لجميع المتغيرات المشتركة، لم يكن للجنس وتمايز الورم أي تأثير كبير على التشخيص، ولكن بالأحرى كان لموقع الورم تأثير كبير. تعزز الأهمية المتغيرة التي تم الحصول عليها من RSF أن الجراحة والمرحلة والتأمين والإقامة والعمر كانت أهم العوامل التنبؤية. كانت القدرة التمييزية لـ COX PH و RSF، على التوالي، 0.771 و 0.798 للمؤشر C بينما كانت دقة COX PH و RSF، على التوالي، 0.257 و 0.207 لـ BS. وهذا يدل على أن قوات الدعم السريع لديها قدرة تمييزية أفضل ودقة تنبؤية. تظهر نتائجنا أن المرضى الذين تزيد أعمارهم عن 70 عامًا، والذين يعيشون في المناطق الريفية، دون تأمين صحي، في مرحلة بعيدة والذين لم يخضعوا لعملية جراحية يشكلون مجموعة فرعية من المرضى الذين يعانون من سوء التشخيص.Translated Description (French)
Résumé L'objectif de notre étude était d'évaluer les taux de survie globale au cancer colorectal à 3 ans et d'identifier les facteurs pronostiques forts associés chez les patients au Maroc grâce à une approche d'apprentissage automatique interprétable. Cette approche est basée sur une forêt aléatoire de survie (RSF) entièrement non paramétrique, intégrant des effets d'importance variable et de dépendance partielle. Les données ont été tirées d'une étude rétrospective portant sur 343 patients diagnostiqués et suivis à l'hôpital universitaire Hassan II. La sélection des covariables a été effectuée en utilisant l'importance variable basée sur la permutation et des graphiques de dépendance partielle ont été affichés pour explorer en profondeur la relation entre l'effet partiel estimé d'un prédicteur donné et les taux de survie. La performance prédictive a été mesurée par deux mesures, l'indice de concordance (C-index) et le score de Brier (BS). Les taux de survie globale à 1, 2 et 3 ans étaient, respectivement, de 87 % (ET = 0,02 ; IC-95 % 0,84-0,91), 77 % (ET = 0,02 ; IC-95 % 0,73-0,82) et 60 % (ET = 0,03 ; IC-95 % 0,54-0,66). Dans le modèle de Cox après ajustement pour toutes les covariables, le sexe, la différenciation tumorale n'a pas eu d'effet significatif sur le pronostic, mais plutôt le site tumoral a eu un effet significatif. L'importance variable obtenue de RSF renforce le fait que la chirurgie, le stade, l'assurance, la résidence et l'âge étaient les facteurs pronostiques les plus importants. La capacité discriminante du Cox PH et du RSF était, respectivement, de 0,771 et 0,798 pour l'indice C tandis que la précision du Cox PH et du RSF était, respectivement, de 0,257 et 0,207 pour le BS. Cela montre que RSF avait à la fois une meilleure capacité discriminatoire et une précision prédictive. Nos résultats montrent que les patients âgés de plus de 70 ans, vivant en milieu rural, sans assurance maladie, à un stade éloigné et n'ayant pas subi d'intervention chirurgicale constituent un sous-groupe de patients de mauvais pronostic.Translated Description (Spanish)
Resumen El objetivo de nuestro estudio fue evaluar las tasas de supervivencia general para el cáncer colorrectal a los 3 años e identificar los factores pronósticos fuertes asociados entre los pacientes en Marruecos a través de un enfoque de aprendizaje automático interpretable. Este enfoque se basa en un bosque aleatorio de supervivencia (RSF) totalmente no paramétrico, que incorpora efectos de importancia variable y dependencia parcial. Los datos se obtuvieron de un estudio retrospectivo de 343 pacientes diagnosticados y seguidos en el Hospital Universitario Hassan II. La selección de covariables se realizó utilizando la variable importancia basada en permutación y se mostraron gráficos de dependencia parcial para explorar en profundidad la relación entre el efecto parcial estimado de un predictor dado y las tasas de supervivencia. El rendimiento predictivo se midió mediante dos métricas, el Índice de Concordancia (índice C) y la Puntuación Brier (BS). Las tasas de supervivencia global a 1, 2 y 3 años fueron, respectivamente, del 87% (SE = 0,02; IC-95% 0,84-0,91), 77% (SE = 0,02; IC-95% 0,73-0,82) y 60% (SE = 0,03; IC-95% 0,54-0,66). En el modelo de Cox después del ajuste para todas las covariables, el sexo, la diferenciación tumoral no tuvo un efecto significativo en el pronóstico, sino que el sitio del tumor tuvo un efecto significativo. La importancia variable obtenida de RSF fortalece que la cirugía, la etapa, el seguro, la residencia y la edad fueron los factores pronósticos más importantes. La capacidad discriminatoria del PH y RSF de Cox fue, respectivamente, 0.771 y 0.798 para el índice C, mientras que la precisión del PH y RSF de Cox fue, respectivamente, 0.257 y 0.207 para el BS. Esto muestra que RSF tuvo una mejor capacidad discriminatoria y precisión predictiva. Nuestros resultados muestran que los pacientes mayores de 70 años, que viven en zonas rurales, sin seguro de salud, en una etapa distante y que no han tenido cirugía constituyen un subgrupo de pacientes con mal pronóstico.Files
s41598-024-51304-3.pdf.pdf
Files
(2.0 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:e37176c64a1bfc70c8fedc145dee95cd
|
2.0 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- عوامل الخطر التي تؤثر على بقاء المرضى المصابين بسرطان القولون والمستقيم في المغرب: تحليل البقاء على قيد الحياة باستخدام نهج التعلم الآلي القابل للتفسير
- Translated title (French)
- Facteurs de risque affectant la survie des patients atteints de cancer colorectal au Maroc : analyse de la survie à l'aide d'une approche d'apprentissage automatique interprétable
- Translated title (Spanish)
- Factores de riesgo que afectan la supervivencia de los pacientes con cáncer colorrectal en Marruecos: análisis de supervivencia utilizando un enfoque interpretable de aprendizaje automático
Identifiers
- Other
- https://openalex.org/W4391743169
- DOI
- 10.1038/s41598-024-51304-3
References
- https://openalex.org/W1514667880
- https://openalex.org/W1651586605
- https://openalex.org/W1807388783
- https://openalex.org/W1829506417
- https://openalex.org/W1829802415
- https://openalex.org/W1978250117
- https://openalex.org/W1986546598
- https://openalex.org/W2023458977
- https://openalex.org/W2041036521
- https://openalex.org/W2044702943
- https://openalex.org/W2045007082
- https://openalex.org/W2052825782
- https://openalex.org/W2062406653
- https://openalex.org/W2064186732
- https://openalex.org/W2069349279
- https://openalex.org/W2072058232
- https://openalex.org/W2084139018
- https://openalex.org/W2095915026
- https://openalex.org/W2106130057
- https://openalex.org/W2110486444
- https://openalex.org/W2142750944
- https://openalex.org/W2144922697
- https://openalex.org/W2482510893
- https://openalex.org/W2513862042
- https://openalex.org/W2612454186
- https://openalex.org/W2614162828
- https://openalex.org/W2742309449
- https://openalex.org/W2806446597
- https://openalex.org/W2891902949
- https://openalex.org/W2892081068
- https://openalex.org/W2910690011
- https://openalex.org/W2911964244
- https://openalex.org/W2916566311
- https://openalex.org/W2949495270
- https://openalex.org/W2954678774
- https://openalex.org/W2972358370
- https://openalex.org/W2982281940
- https://openalex.org/W2994706149
- https://openalex.org/W3012634560
- https://openalex.org/W3013552374
- https://openalex.org/W3092798356
- https://openalex.org/W3093548145
- https://openalex.org/W3125507679
- https://openalex.org/W3128646645
- https://openalex.org/W4212883601
- https://openalex.org/W4281663037
- https://openalex.org/W4293241248
- https://openalex.org/W4295472519
- https://openalex.org/W4296886862