Published July 16, 2024 | Version v1
Publication Open

At-admission prediction of mortality and pulmonary embolism in an international cohort of hospitalised patients with COVID-19 using statistical and machine learning methods

Creators

  • 1. University of Oxford
  • 2. Queen Elizabeth Hospital
  • 3. Ministry of Health
  • 4. Amsterdam University Medical Centers
  • 5. King Abdulaziz Medical City
  • 6. Chiba University Hospital
  • 7. Inserm
  • 8. Erasmus Hospital
  • 9. University of Pennsylvania
  • 10. University Hospital Frankfurt
  • 11. University of Parma
  • 12. Centro Hospitalar de Vila Nova de Gaia
  • 13. King Faisal Specialist Hospital & Research Centre
  • 14. University Hospital Kerry
  • 15. St. Vincent's University Hospital
  • 16. Surin Hospital
  • 17. Our Lady of Lourdes Hospital
  • 18. Hamad General Hospital
  • 19. Centre Hospitalier Sainte-Anne
  • 20. Teine Keijinkai Hospital
  • 21. Beaumont Hospital
  • 22. Northwell Health
  • 23. Adan Hospital
  • 24. University Hospital Galway
  • 25. Vall d'Hebron Hospital Universitari
  • 26. Azienda Ospedaliera Universitaria Policlinico "Paolo Giaccone" di Palermo
  • 27. University of Edinburgh
  • 28. Centre Hospitalier Universitaire de Rouen
  • 29. Amiri Hospital
  • 30. St Bernard's Hospital
  • 31. Sligo University Hospital
  • 32. Centre Hospitalier Universitaire de Lille
  • 33. Centre Hospitalier Universitaire de Nantes
  • 34. Hospitais da Universidade de Coimbra
  • 35. Hospital de São José
  • 36. Hospital Curry Cabral
  • 37. Hospital Sungai Buloh
  • 38. Catharina Ziekenhuis
  • 39. Radboud University Nijmegen
  • 40. Ottawa Hospital
  • 41. University of Campania "Luigi Vanvitelli"
  • 42. Centre Hospitalier Universitaire Amiens-Picardie
  • 43. Ospedale Sacro Cuore Don Calabria
  • 44. Centre Hospitalier Régional Universitaire de Brest
  • 45. Hospital Kuala Lumpur
  • 46. Agostino Gemelli University Polyclinic
  • 47. Fundação Oswaldo Cruz
  • 48. National Institute of Cardiovascular Diseases
  • 49. National Guard Health Affairs
  • 50. Centro Hospitalar do Porto
  • 51. Instituto Nacional del Tórax
  • 52. Istituto Mediterraneo per i Trapianti e Terapie ad Alta Specializzazione
  • 53. Centre Intégré de Santé et Services Sociaux de Chaudière-Appalache
  • 54. LMU Klinikum
  • 55. Hôpital Européen Georges-Pompidou
  • 56. Groote Schuur Hospital
  • 57. University of Iowa
  • 58. St. Boniface Hospital
  • 59. Fujieda Municipal General Hospital
  • 60. Hospital Universitario Puerta de Hierro Majadahonda
  • 61. Lao-Oxford-Mahosot Hospital-Wellcome Trust Research Unit
  • 62. Hôpital Intercommunal de Créteil
  • 63. McGill University Health Centre
  • 64. Centre Hospitalier de Lens
  • 65. Centre Hospitalier de Perpignan
  • 66. Hôpital Lariboisière
  • 67. Assistance Publique – Hôpitaux de Paris
  • 68. Hôpital Cochin
  • 69. Centre Hospitalier Intercommunal de Villeneuve-Saint-Georges
  • 70. Roslin Institute
  • 71. Rush University Medical Center

Description

By September 2022, more than 600 million cases of SARS-CoV-2 infection have been reported globally, resulting in over 6.5 million deaths. COVID-19 mortality risk estimators are often, however, developed with small unrepresentative samples and with methodological limitations. It is highly important to develop predictive tools for pulmonary embolism (PE) in COVID-19 patients as one of the most severe preventable complications of COVID-19. Early recognition can help provide life-saving targeted anti-coagulation therapy right at admission. Using a dataset of more than 800,000 COVID-19 patients from an international cohort, we propose a cost-sensitive gradient-boosted machine learning model that predicts occurrence of PE and death at admission. Logistic regression, Cox proportional hazards models, and Shapley values were used to identify key predictors for PE and death. Our prediction model had a test AUROC of 75.9% and 74.2%, and sensitivities of 67.5% and 72.7% for PE and all-cause mortality respectively on a highly diverse and held-out test set. The PE prediction model was also evaluated on patients in UK and Spain separately with test results of 74.5% AUROC, 63.5% sensitivity and 78.9% AUROC, 95.7% sensitivity. Age, sex, region of admission, comorbidities (chronic cardiac and pulmonary disease, dementia, diabetes, hypertension, cancer, obesity, smoking), and symptoms (any, confusion, chest pain, fatigue, headache, fever, muscle or joint pain, shortness of breath) were the most important clinical predictors at admission. Age, overall presence of symptoms, shortness of breath, and hypertension were found to be key predictors for PE using our extreme gradient boosted model. This analysis based on the, until now, largest global dataset for this set of problems can inform hospital prioritisation policy and guide long term clinical research and decision-making for COVID-19 patients globally. Our machine learning model developed from an international cohort can serve to better regulate hospital risk prioritisation of at-risk patients.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

بحلول سبتمبر 2022، تم الإبلاغ عن أكثر من 600 مليون حالة إصابة بفيروس كورونا 2 المرتبط بمتلازمة الجهاز التنفسي الحادة الوخيمة على مستوى العالم، مما أدى إلى أكثر من 6.5 مليون حالة وفاة. ومع ذلك، غالبًا ما يتم تطوير تقديرات مخاطر الوفيات بسبب كوفيد-19 باستخدام عينات صغيرة غير تمثيلية وبقيود منهجية. من المهم للغاية تطوير أدوات تنبؤية للانسداد الرئوي (PE) لدى مرضى كوفيد-19 باعتبارها واحدة من أخطر مضاعفات كوفيد-19 التي يمكن الوقاية منها. يمكن أن يساعد التعرف المبكر في توفير علاج مستهدف لإنقاذ الحياة مضاد للتخثر عند الدخول مباشرة. باستخدام مجموعة بيانات تضم أكثر من 800000 مريض بكوفيد-19 من مجموعة دولية، نقترح نموذجًا للتعلم الآلي مدعومًا بالتدرج حساسًا للتكلفة يتنبأ بحدوث PE والوفاة عند القبول. تم استخدام الانحدار اللوجستي، ونماذج المخاطر النسبية COX، وقيم Shapley لتحديد المؤشرات الرئيسية لـ PE والوفاة. كان لنموذج التنبؤ لدينا اختبار AUROC بنسبة 75.9 ٪ و 74.2 ٪، وحساسيات 67.5 ٪ و 72.7 ٪ للوفيات الناجمة عن ممارسة الرياضة وجميع الأسباب على التوالي في مجموعة اختبار متنوعة للغاية وصامدة. تم تقييم نموذج تنبؤ PE أيضًا على المرضى في المملكة المتحدة وإسبانيا بشكل منفصل مع نتائج اختبار 74.5 ٪ AUROC وحساسية 63.5 ٪ و 78.9 ٪ AUROC وحساسية 95.7 ٪. كان العمر والجنس ومنطقة القبول والأمراض المصاحبة (أمراض القلب والرئة المزمنة والخرف والسكري وارتفاع ضغط الدم والسرطان والسمنة والتدخين) والأعراض (أي الارتباك وآلام الصدر والتعب والصداع والحمى وآلام العضلات أو المفاصل وضيق التنفس) من أهم المؤشرات السريرية عند القبول. تم العثور على العمر والوجود العام للأعراض وضيق التنفس وارتفاع ضغط الدم كمؤشرات رئيسية لـ PE باستخدام نموذجنا المعزز بالتدرج الشديد. يمكن لهذا التحليل القائم على أكبر مجموعة بيانات عالمية لهذه المجموعة من المشاكل، حتى الآن، أن يوجه سياسة تحديد أولويات المستشفى ويوجه البحوث السريرية طويلة الأجل وصنع القرار لمرضى كوفيد-19 على مستوى العالم. يمكن أن يعمل نموذج التعلم الآلي الخاص بنا الذي تم تطويره من مجموعة دولية على تنظيم أولويات مخاطر المستشفيات للمرضى المعرضين للخطر بشكل أفضل.

Translated Description (French)

En septembre 2022, plus de 600 millions de cas d'infection par le SRAS-CoV-2 ont été signalés dans le monde, entraînant plus de 6,5 millions de décès. Cependant, les estimateurs du risque de mortalité lié à la COVID-19 sont souvent élaborés avec de petits échantillons non représentatifs et avec des limites méthodologiques. Il est très important de développer des outils prédictifs de l'embolie pulmonaire (EP) chez les patients atteints de COVID-19 comme l'une des complications évitables les plus graves de la COVID-19. Une reconnaissance précoce peut aider à fournir un traitement anticoagulant ciblé et salvateur dès l'admission. En utilisant un ensemble de données de plus de 800 000 patients COVID-19 d'une cohorte internationale, nous proposons un modèle d'apprentissage automatique à gradient sensible aux coûts qui prédit la survenue de l'EP et le décès à l'admission. La régression logistique, les modèles de risques proportionnels de Cox et les valeurs de Shapley ont été utilisés pour identifier les principaux prédicteurs d'EP et de décès. Notre modèle de prédiction avait un AUROC de test de 75,9% et 74,2%, et des sensibilités de 67,5% et 72,7% pour l'EP et la mortalité toutes causes confondues respectivement sur un ensemble de tests très diversifié et tenu. Le modèle de prédiction de l'EP a également été évalué séparément sur des patients au Royaume-Uni et en Espagne avec des résultats de test de 74,5 % d'AUROC, 63,5 % de sensibilité et 78,9 % d'AUROC, 95,7 % de sensibilité. L'âge, le sexe, la région d'admission, les comorbidités (maladie cardiaque et pulmonaire chronique, démence, diabète, hypertension, cancer, obésité, tabagisme) et les symptômes (confusion, douleurs thoraciques, fatigue, maux de tête, fièvre, douleurs musculaires ou articulaires, essoufflement) étaient les prédicteurs cliniques les plus importants à l'admission. L'âge, la présence globale de symptômes, l'essoufflement et l'hypertension se sont révélés être des prédicteurs clés de l'EP en utilisant notre modèle à gradient extrême boosté. Cette analyse basée sur le plus grand ensemble de données mondiales, jusqu'à présent, pour cet ensemble de problèmes peut éclairer la politique de priorisation des hôpitaux et guider la recherche clinique et la prise de décision à long terme pour les patients atteints de COVID-19 dans le monde. Notre modèle d'apprentissage automatique développé à partir d'une cohorte internationale peut servir à mieux réguler la priorisation des risques hospitaliers des patients à risque.

Translated Description (Spanish)

Para septiembre de 2022, se habían reportado más de 600 millones de casos de infección por SARS-CoV-2 en todo el mundo, lo que resultó en más de 6,5 millones de muertes. Sin embargo, los estimadores de riesgo de mortalidad por COVID-19 a menudo se desarrollan con pequeñas muestras no representativas y con limitaciones metodológicas. Es muy importante desarrollar herramientas predictivas para la embolia pulmonar (EP) en pacientes con COVID-19 como una de las complicaciones prevenibles más graves de COVID-19. El reconocimiento temprano puede ayudar a proporcionar una terapia anticoagulante dirigida que salve vidas desde el momento del ingreso. Utilizando un conjunto de datos de más de 800,000 pacientes con COVID-19 de una cohorte internacional, proponemos un modelo de aprendizaje automático impulsado por gradiente sensible a los costos que predice la aparición de EP y la muerte al ingreso. La regresión logística, los modelos de riesgos proporcionales de Cox y los valores de Shapley se utilizaron para identificar los predictores clave de EP y muerte. Nuestro modelo de predicción tuvo un AUROC de prueba de 75.9% y 74.2%, y sensibilidades de 67.5% y 72.7% para PE y mortalidad por todas las causas, respectivamente, en un conjunto de pruebas muy diverso y mantenido. El modelo de predicción de PE también se evaluó en pacientes en el Reino Unido y España por separado con resultados de pruebas de 74.5% de AUROC, 63.5% de sensibilidad y 78.9% de AUROC, 95.7% de sensibilidad. La edad, el sexo, la región de ingreso, las comorbilidades (enfermedad cardíaca y pulmonar crónica, demencia, diabetes, hipertensión, cáncer, obesidad, tabaquismo) y los síntomas (cualquier confusión, dolor en el pecho, fatiga, dolor de cabeza, fiebre, dolor muscular o articular, dificultad para respirar) fueron los predictores clínicos más importantes al ingreso. Se descubrió que la edad, la presencia general de síntomas, la dificultad para respirar y la hipertensión eran factores predictivos clave para la EP utilizando nuestro modelo impulsado por gradiente extremo. Este análisis basado en el, hasta ahora, mayor conjunto de datos globales para este conjunto de problemas puede informar la política de priorización del hospital y guiar la investigación clínica a largo plazo y la toma de decisiones para los pacientes con COVID-19 a nivel mundial. Nuestro modelo de aprendizaje automático desarrollado a partir de una cohorte internacional puede servir para regular mejor la priorización del riesgo hospitalario de los pacientes en riesgo.

Files

s41598-024-63212-7.pdf.pdf

Files (5.7 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:a5981a0a950d71d001c16ae4ada7d0db
5.7 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
التنبؤ عند القبول بالوفيات والانسداد الرئوي في مجموعة دولية من المرضى في المستشفى المصابين بـ COVID -19 باستخدام طرق التعلم الإحصائي والآلي
Translated title (French)
Prévision à l'admission de la mortalité et de l'embolie pulmonaire dans une cohorte internationale de patients hospitalisés atteints de COVID-19 à l'aide de méthodes statistiques et d'apprentissage automatique
Translated title (Spanish)
Predicción de mortalidad y embolia pulmonar en el momento del ingreso en una cohorte internacional de pacientes hospitalizados con COVID-19 utilizando métodos estadísticos y de aprendizaje automático

Identifiers

Other
https://openalex.org/W4400687382
DOI
10.1038/s41598-024-63212-7

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Thailand

References

  • https://openalex.org/W2151455241
  • https://openalex.org/W2587866267
  • https://openalex.org/W2999615587
  • https://openalex.org/W3004157670
  • https://openalex.org/W3008090866
  • https://openalex.org/W3009885589
  • https://openalex.org/W3034523319
  • https://openalex.org/W3036480973
  • https://openalex.org/W3108118145
  • https://openalex.org/W3110432145
  • https://openalex.org/W3124413935
  • https://openalex.org/W3125804999
  • https://openalex.org/W3127566540
  • https://openalex.org/W3144611861
  • https://openalex.org/W3146177907
  • https://openalex.org/W3153859749
  • https://openalex.org/W3156360893
  • https://openalex.org/W3188444363
  • https://openalex.org/W3189663229
  • https://openalex.org/W3198931453
  • https://openalex.org/W3217066695
  • https://openalex.org/W4223448922
  • https://openalex.org/W4224279004
  • https://openalex.org/W4280609259