At-admission prediction of mortality and pulmonary embolism in an international cohort of hospitalised patients with COVID-19 using statistical and machine learning methods
Creators
- 
    
      Munib Mesinovic1
  
  
      
      
        
 - 
    
      Xin Ci Wong
  
  
      
      
        
 - 
    
      Giri Shan Rajahram2, 3
  
  
      
      
        
 - 
    
      Barbara Wanjiru Citarella1
  
  
      
      
        
 - 
    
      Kalaiarasu M. Peariasamy
  
  
      
      
        
 - Frank van Someren Greve4
 - 
    
      Piero Olliaro1
  
  
      
      
        
 - 
    
      Laura Merson1
  
  
      
      
        
 - 
    
      Lei Clifton1
  
  
      
      
        
 - 
    
      Christiana Kartsonaki1
  
  
      
      
        
 - Sheryl Ann Abdukahil5
 - Nurul Najmee Abdulkadir
 - 
    
      Ryuzo Abe6
  
  
      
      
        
 - 
    
      Laurent Abel7
  
  
      
      
        
 - Amal Abrous7
 - 
    
      Lara Absil8
  
  
      
      
        
 - Andrew Acker9
 - Shingo Adachi
 - 
    
      Elisabeth Adam10
  
  
      
      
        
 - Enrico Adriano11
 - 
    
      Diana Adrião12
  
  
      
      
        
 - Saleh Al Ageel13
 - 
    
      Shakeel Ahmed14
  
  
      
      
        
 - 
    
      Marina Aiello11
  
  
      
      
        
 - 
    
      Kate Ainscough15
  
  
      
      
        
 - 
    
      Eka Airlangga16
  
  
      
      
        
 - Tharwat Aisa17
 - 
    
      Ali Ait Hssain18
  
  
      
      
        
 - 
    
      Younes Ait Tamlihat19
  
  
      
      
        
 - Takako Akimoto20
 - Ernita Akmal
 - Eman Al Qasim5
 - 
    
      Razi Alalqam21
  
  
      
      
        
 - Angela Alberti22
 - Tala Al-Dabbous23
 - Senthilkumar Alegesan24
 - Cynthia Alegre25
 - Marta Alessi26
 - 
    
      Beatrice Alex27
  
  
      
      
        
 - 
    
      Kévin Alexandre28
  
  
      
      
        
 - 
    
      Abdulrahman Al‐Fares29
  
  
      
      
        
 - 
    
      Huda Alfoudri23
  
  
      
      
        
 - Adam Ali30
 - 
    
      Imran Ali31
  
  
      
      
        
 - Kazali Enagnon Alidjnou32
 - Jeffrey Aliudin18
 - Qabas Alkhafajee14
 - 
    
      Clotilde Allavena33
  
  
      
      
        
 - Nathalie Allou
 - 
    
      João Alves34
  
  
      
      
        
 - 
    
      João Alves35
  
  
      
      
        
 - 
    
      Rita Vieira Alves36
  
  
      
      
        
 - Joana Alves Cabrita36
 - 
    
      Maria Esméria Corezola do Amaral36
  
  
      
      
        
 - Nur Amira37
 - 
    
      Heidi S. M. Ammerlaan38, 39
  
  
      
      
        
 - Phoebe Ampaw40
 - Roberto Andini41
 - 
    
      Claire Andréjak42
  
  
      
      
        
 - 
    
      Andrea Angheben43
  
  
      
      
        
 - 
    
      François Angoulvant7
  
  
      
      
        
 - Séverine Ansart44
 - Sivanesen Anthonidass45
 - Massimo Antonelli46
 - 
    
      Carlos Brito47
  
  
      
      
        
 - Kazi Rubayet Anwar48
 - Ardiyan Apriyana
 - 
    
      Yaseen M. Arabi49
  
  
      
      
        
 - 
    
      Irene Aragão50
  
  
      
      
        
 - 
    
      Francisco Arancibia51
  
  
      
      
        
 - 
    
      Gail Carson47
  
  
      
      
        
 - 
    
      Antonio Arcadipane52
  
  
      
      
        
 - 
    
      Patrick Archambault53
  
  
      
      
        
 - 
    
      Lukas Arenz54
  
  
      
      
        
 - 
    
      Jean‐Benoît Arlet55
  
  
      
      
        
 - 
    
      Christel Arnold-Day56
  
  
      
      
        
 - 
    
      Lovkesh Arora57
  
  
      
      
        
 - Rakesh Arora58
 - 
    
      Élise Artaud-Macari28
  
  
      
      
        
 - 
    
      Diptesh Aryal
  
  
      
      
        
 - 
    
      Motohiro Asaki59
  
  
      
      
        
 - 
    
      Ángel Asensio60
  
  
      
      
        
 - 
    
      Elizabeth A. Ashley61
  
  
      
      
        
 - 
    
      Muhammad Ashraf37
  
  
      
      
        
 - 
    
      Jean-Baptiste Assié62
  
  
      
      
        
 - Amirul Asyraf37
 - Anika Atique63
 - Am Udara Lakshan Attanyake
 - Johann Auchabie64
 - 
    
      Hugues Aumaître65
  
  
      
      
        
 - Adrien Auvet55
 - Laurène Azemar66, 67
 - Cécile Azoulay68, 67
 - 
    
      Benjamin Bach27
  
  
      
      
        
 - Delphine Bachelet7
 - C. Badr69
 - Nadia Baig
 - J. Kenneth Baillie70, 27
 - 
    
      J. Kevin Baird16
  
  
      
      
        
 - 
    
      Erica Bak71
  
  
      
      
        
 
- 1. University of Oxford
 - 2. Queen Elizabeth Hospital
 - 3. Ministry of Health
 - 4. Amsterdam University Medical Centers
 - 5. King Abdulaziz Medical City
 - 6. Chiba University Hospital
 - 7. Inserm
 - 8. Erasmus Hospital
 - 9. University of Pennsylvania
 - 10. University Hospital Frankfurt
 - 11. University of Parma
 - 12. Centro Hospitalar de Vila Nova de Gaia
 - 13. King Faisal Specialist Hospital & Research Centre
 - 14. University Hospital Kerry
 - 15. St. Vincent's University Hospital
 - 16. Surin Hospital
 - 17. Our Lady of Lourdes Hospital
 - 18. Hamad General Hospital
 - 19. Centre Hospitalier Sainte-Anne
 - 20. Teine Keijinkai Hospital
 - 21. Beaumont Hospital
 - 22. Northwell Health
 - 23. Adan Hospital
 - 24. University Hospital Galway
 - 25. Vall d'Hebron Hospital Universitari
 - 26. Azienda Ospedaliera Universitaria Policlinico "Paolo Giaccone" di Palermo
 - 27. University of Edinburgh
 - 28. Centre Hospitalier Universitaire de Rouen
 - 29. Amiri Hospital
 - 30. St Bernard's Hospital
 - 31. Sligo University Hospital
 - 32. Centre Hospitalier Universitaire de Lille
 - 33. Centre Hospitalier Universitaire de Nantes
 - 34. Hospitais da Universidade de Coimbra
 - 35. Hospital de São José
 - 36. Hospital Curry Cabral
 - 37. Hospital Sungai Buloh
 - 38. Catharina Ziekenhuis
 - 39. Radboud University Nijmegen
 - 40. Ottawa Hospital
 - 41. University of Campania "Luigi Vanvitelli"
 - 42. Centre Hospitalier Universitaire Amiens-Picardie
 - 43. Ospedale Sacro Cuore Don Calabria
 - 44. Centre Hospitalier Régional Universitaire de Brest
 - 45. Hospital Kuala Lumpur
 - 46. Agostino Gemelli University Polyclinic
 - 47. Fundação Oswaldo Cruz
 - 48. National Institute of Cardiovascular Diseases
 - 49. National Guard Health Affairs
 - 50. Centro Hospitalar do Porto
 - 51. Instituto Nacional del Tórax
 - 52. Istituto Mediterraneo per i Trapianti e Terapie ad Alta Specializzazione
 - 53. Centre Intégré de Santé et Services Sociaux de Chaudière-Appalache
 - 54. LMU Klinikum
 - 55. Hôpital Européen Georges-Pompidou
 - 56. Groote Schuur Hospital
 - 57. University of Iowa
 - 58. St. Boniface Hospital
 - 59. Fujieda Municipal General Hospital
 - 60. Hospital Universitario Puerta de Hierro Majadahonda
 - 61. Lao-Oxford-Mahosot Hospital-Wellcome Trust Research Unit
 - 62. Hôpital Intercommunal de Créteil
 - 63. McGill University Health Centre
 - 64. Centre Hospitalier de Lens
 - 65. Centre Hospitalier de Perpignan
 - 66. Hôpital Lariboisière
 - 67. Assistance Publique – Hôpitaux de Paris
 - 68. Hôpital Cochin
 - 69. Centre Hospitalier Intercommunal de Villeneuve-Saint-Georges
 - 70. Roslin Institute
 - 71. Rush University Medical Center
 
Description
By September 2022, more than 600 million cases of SARS-CoV-2 infection have been reported globally, resulting in over 6.5 million deaths. COVID-19 mortality risk estimators are often, however, developed with small unrepresentative samples and with methodological limitations. It is highly important to develop predictive tools for pulmonary embolism (PE) in COVID-19 patients as one of the most severe preventable complications of COVID-19. Early recognition can help provide life-saving targeted anti-coagulation therapy right at admission. Using a dataset of more than 800,000 COVID-19 patients from an international cohort, we propose a cost-sensitive gradient-boosted machine learning model that predicts occurrence of PE and death at admission. Logistic regression, Cox proportional hazards models, and Shapley values were used to identify key predictors for PE and death. Our prediction model had a test AUROC of 75.9% and 74.2%, and sensitivities of 67.5% and 72.7% for PE and all-cause mortality respectively on a highly diverse and held-out test set. The PE prediction model was also evaluated on patients in UK and Spain separately with test results of 74.5% AUROC, 63.5% sensitivity and 78.9% AUROC, 95.7% sensitivity. Age, sex, region of admission, comorbidities (chronic cardiac and pulmonary disease, dementia, diabetes, hypertension, cancer, obesity, smoking), and symptoms (any, confusion, chest pain, fatigue, headache, fever, muscle or joint pain, shortness of breath) were the most important clinical predictors at admission. Age, overall presence of symptoms, shortness of breath, and hypertension were found to be key predictors for PE using our extreme gradient boosted model. This analysis based on the, until now, largest global dataset for this set of problems can inform hospital prioritisation policy and guide long term clinical research and decision-making for COVID-19 patients globally. Our machine learning model developed from an international cohort can serve to better regulate hospital risk prioritisation of at-risk patients.
Translated Descriptions
Translated Description (Arabic)
بحلول سبتمبر 2022، تم الإبلاغ عن أكثر من 600 مليون حالة إصابة بفيروس كورونا 2 المرتبط بمتلازمة الجهاز التنفسي الحادة الوخيمة على مستوى العالم، مما أدى إلى أكثر من 6.5 مليون حالة وفاة. ومع ذلك، غالبًا ما يتم تطوير تقديرات مخاطر الوفيات بسبب كوفيد-19 باستخدام عينات صغيرة غير تمثيلية وبقيود منهجية. من المهم للغاية تطوير أدوات تنبؤية للانسداد الرئوي (PE) لدى مرضى كوفيد-19 باعتبارها واحدة من أخطر مضاعفات كوفيد-19 التي يمكن الوقاية منها. يمكن أن يساعد التعرف المبكر في توفير علاج مستهدف لإنقاذ الحياة مضاد للتخثر عند الدخول مباشرة. باستخدام مجموعة بيانات تضم أكثر من 800000 مريض بكوفيد-19 من مجموعة دولية، نقترح نموذجًا للتعلم الآلي مدعومًا بالتدرج حساسًا للتكلفة يتنبأ بحدوث PE والوفاة عند القبول. تم استخدام الانحدار اللوجستي، ونماذج المخاطر النسبية COX، وقيم Shapley لتحديد المؤشرات الرئيسية لـ PE والوفاة. كان لنموذج التنبؤ لدينا اختبار AUROC بنسبة 75.9 ٪ و 74.2 ٪، وحساسيات 67.5 ٪ و 72.7 ٪ للوفيات الناجمة عن ممارسة الرياضة وجميع الأسباب على التوالي في مجموعة اختبار متنوعة للغاية وصامدة. تم تقييم نموذج تنبؤ PE أيضًا على المرضى في المملكة المتحدة وإسبانيا بشكل منفصل مع نتائج اختبار 74.5 ٪ AUROC وحساسية 63.5 ٪ و 78.9 ٪ AUROC وحساسية 95.7 ٪. كان العمر والجنس ومنطقة القبول والأمراض المصاحبة (أمراض القلب والرئة المزمنة والخرف والسكري وارتفاع ضغط الدم والسرطان والسمنة والتدخين) والأعراض (أي الارتباك وآلام الصدر والتعب والصداع والحمى وآلام العضلات أو المفاصل وضيق التنفس) من أهم المؤشرات السريرية عند القبول. تم العثور على العمر والوجود العام للأعراض وضيق التنفس وارتفاع ضغط الدم كمؤشرات رئيسية لـ PE باستخدام نموذجنا المعزز بالتدرج الشديد. يمكن لهذا التحليل القائم على أكبر مجموعة بيانات عالمية لهذه المجموعة من المشاكل، حتى الآن، أن يوجه سياسة تحديد أولويات المستشفى ويوجه البحوث السريرية طويلة الأجل وصنع القرار لمرضى كوفيد-19 على مستوى العالم. يمكن أن يعمل نموذج التعلم الآلي الخاص بنا الذي تم تطويره من مجموعة دولية على تنظيم أولويات مخاطر المستشفيات للمرضى المعرضين للخطر بشكل أفضل.Translated Description (French)
En septembre 2022, plus de 600 millions de cas d'infection par le SRAS-CoV-2 ont été signalés dans le monde, entraînant plus de 6,5 millions de décès. Cependant, les estimateurs du risque de mortalité lié à la COVID-19 sont souvent élaborés avec de petits échantillons non représentatifs et avec des limites méthodologiques. Il est très important de développer des outils prédictifs de l'embolie pulmonaire (EP) chez les patients atteints de COVID-19 comme l'une des complications évitables les plus graves de la COVID-19. Une reconnaissance précoce peut aider à fournir un traitement anticoagulant ciblé et salvateur dès l'admission. En utilisant un ensemble de données de plus de 800 000 patients COVID-19 d'une cohorte internationale, nous proposons un modèle d'apprentissage automatique à gradient sensible aux coûts qui prédit la survenue de l'EP et le décès à l'admission. La régression logistique, les modèles de risques proportionnels de Cox et les valeurs de Shapley ont été utilisés pour identifier les principaux prédicteurs d'EP et de décès. Notre modèle de prédiction avait un AUROC de test de 75,9% et 74,2%, et des sensibilités de 67,5% et 72,7% pour l'EP et la mortalité toutes causes confondues respectivement sur un ensemble de tests très diversifié et tenu. Le modèle de prédiction de l'EP a également été évalué séparément sur des patients au Royaume-Uni et en Espagne avec des résultats de test de 74,5 % d'AUROC, 63,5 % de sensibilité et 78,9 % d'AUROC, 95,7 % de sensibilité. L'âge, le sexe, la région d'admission, les comorbidités (maladie cardiaque et pulmonaire chronique, démence, diabète, hypertension, cancer, obésité, tabagisme) et les symptômes (confusion, douleurs thoraciques, fatigue, maux de tête, fièvre, douleurs musculaires ou articulaires, essoufflement) étaient les prédicteurs cliniques les plus importants à l'admission. L'âge, la présence globale de symptômes, l'essoufflement et l'hypertension se sont révélés être des prédicteurs clés de l'EP en utilisant notre modèle à gradient extrême boosté. Cette analyse basée sur le plus grand ensemble de données mondiales, jusqu'à présent, pour cet ensemble de problèmes peut éclairer la politique de priorisation des hôpitaux et guider la recherche clinique et la prise de décision à long terme pour les patients atteints de COVID-19 dans le monde. Notre modèle d'apprentissage automatique développé à partir d'une cohorte internationale peut servir à mieux réguler la priorisation des risques hospitaliers des patients à risque.Translated Description (Spanish)
Para septiembre de 2022, se habían reportado más de 600 millones de casos de infección por SARS-CoV-2 en todo el mundo, lo que resultó en más de 6,5 millones de muertes. Sin embargo, los estimadores de riesgo de mortalidad por COVID-19 a menudo se desarrollan con pequeñas muestras no representativas y con limitaciones metodológicas. Es muy importante desarrollar herramientas predictivas para la embolia pulmonar (EP) en pacientes con COVID-19 como una de las complicaciones prevenibles más graves de COVID-19. El reconocimiento temprano puede ayudar a proporcionar una terapia anticoagulante dirigida que salve vidas desde el momento del ingreso. Utilizando un conjunto de datos de más de 800,000 pacientes con COVID-19 de una cohorte internacional, proponemos un modelo de aprendizaje automático impulsado por gradiente sensible a los costos que predice la aparición de EP y la muerte al ingreso. La regresión logística, los modelos de riesgos proporcionales de Cox y los valores de Shapley se utilizaron para identificar los predictores clave de EP y muerte. Nuestro modelo de predicción tuvo un AUROC de prueba de 75.9% y 74.2%, y sensibilidades de 67.5% y 72.7% para PE y mortalidad por todas las causas, respectivamente, en un conjunto de pruebas muy diverso y mantenido. El modelo de predicción de PE también se evaluó en pacientes en el Reino Unido y España por separado con resultados de pruebas de 74.5% de AUROC, 63.5% de sensibilidad y 78.9% de AUROC, 95.7% de sensibilidad. La edad, el sexo, la región de ingreso, las comorbilidades (enfermedad cardíaca y pulmonar crónica, demencia, diabetes, hipertensión, cáncer, obesidad, tabaquismo) y los síntomas (cualquier confusión, dolor en el pecho, fatiga, dolor de cabeza, fiebre, dolor muscular o articular, dificultad para respirar) fueron los predictores clínicos más importantes al ingreso. Se descubrió que la edad, la presencia general de síntomas, la dificultad para respirar y la hipertensión eran factores predictivos clave para la EP utilizando nuestro modelo impulsado por gradiente extremo. Este análisis basado en el, hasta ahora, mayor conjunto de datos globales para este conjunto de problemas puede informar la política de priorización del hospital y guiar la investigación clínica a largo plazo y la toma de decisiones para los pacientes con COVID-19 a nivel mundial. Nuestro modelo de aprendizaje automático desarrollado a partir de una cohorte internacional puede servir para regular mejor la priorización del riesgo hospitalario de los pacientes en riesgo.Files
      
        s41598-024-63212-7.pdf.pdf
        
      
    
    
      
        Files
         (5.7 MB)
        
      
    
    | Name | Size | Download all | 
|---|---|---|
| 
          
          md5:a5981a0a950d71d001c16ae4ada7d0db
           | 
        
        5.7 MB | Preview Download | 
Additional details
Additional titles
- Translated title (Arabic)
 - التنبؤ عند القبول بالوفيات والانسداد الرئوي في مجموعة دولية من المرضى في المستشفى المصابين بـ COVID -19 باستخدام طرق التعلم الإحصائي والآلي
 - Translated title (French)
 - Prévision à l'admission de la mortalité et de l'embolie pulmonaire dans une cohorte internationale de patients hospitalisés atteints de COVID-19 à l'aide de méthodes statistiques et d'apprentissage automatique
 - Translated title (Spanish)
 - Predicción de mortalidad y embolia pulmonar en el momento del ingreso en una cohorte internacional de pacientes hospitalizados con COVID-19 utilizando métodos estadísticos y de aprendizaje automático
 
Identifiers
- Other
 - https://openalex.org/W4400687382
 - DOI
 - 10.1038/s41598-024-63212-7
 
            
              References
            
          
        - https://openalex.org/W2151455241
 - https://openalex.org/W2587866267
 - https://openalex.org/W2999615587
 - https://openalex.org/W3004157670
 - https://openalex.org/W3008090866
 - https://openalex.org/W3009885589
 - https://openalex.org/W3034523319
 - https://openalex.org/W3036480973
 - https://openalex.org/W3108118145
 - https://openalex.org/W3110432145
 - https://openalex.org/W3124413935
 - https://openalex.org/W3125804999
 - https://openalex.org/W3127566540
 - https://openalex.org/W3144611861
 - https://openalex.org/W3146177907
 - https://openalex.org/W3153859749
 - https://openalex.org/W3156360893
 - https://openalex.org/W3188444363
 - https://openalex.org/W3189663229
 - https://openalex.org/W3198931453
 - https://openalex.org/W3217066695
 - https://openalex.org/W4223448922
 - https://openalex.org/W4224279004
 - https://openalex.org/W4280609259