Machine learning approaches in Covid-19 severity risk prediction in Morocco
Creators
- 1. Mohammed V University
- 2. University of Hassan II Casablanca
Description
Abstract The purpose of this study is to develop and test machine learning-based models for COVID-19 severity prediction. COVID-19 test samples from 337 COVID-19 positive patients at Cheikh Zaid Hospital were grouped according to the severity of their illness. Ours is the first study to estimate illness severity by combining biological and non-biological data from patients with COVID-19. Moreover the use of ML for therapeutic purposes in Morocco is currently restricted, and ours is the first study to investigate the severity of COVID-19. When data analysis approaches were used to uncover patterns and essential characteristics in the data, C-reactive protein, platelets, and D-dimers were determined to be the most associated to COVID-19 severity prediction. In this research, many data reduction algorithms were used, and Machine Learning models were trained to predict the severity of sickness using patient data. A new feature engineering method based on topological data analysis called Uniform Manifold Approximation and Projection (UMAP) shown that it achieves better results. It has 100% accuracy, specificity, sensitivity, and ROC curve in conducting a prognostic prediction using different machine learning classifiers such as X_GBoost, AdaBoost, Random Forest, and ExtraTrees. The proposed approach aims to assist hospitals and medical facilities in determining who should be seen first and who has a higher priority for admission to the hospital.
Translated Descriptions
Translated Description (Arabic)
الملخص الغرض من هذه الدراسة هو تطوير واختبار النماذج القائمة على التعلم الآلي للتنبؤ بخطورة COVID -19. تم تجميع عينات اختبار COVID -19 من 337 مريضًا مصابًا بـ COVID -19 في مستشفى الشيخ زيد وفقًا لشدة مرضهم. دراستنا هي أول دراسة لتقدير شدة المرض من خلال الجمع بين البيانات البيولوجية وغير البيولوجية من المرضى المصابين بـ COVID -19. علاوة على ذلك، فإن استخدام غسل الأموال للأغراض العلاجية في المغرب مقيد حاليًا، ودراستنا هي أول دراسة تحقق في شدة كوفيد-19. عندما تم استخدام مناهج تحليل البيانات للكشف عن الأنماط والخصائص الأساسية في البيانات، تم تحديد البروتين التفاعلي C والصفائح الدموية و D - dimers على أنها الأكثر ارتباطًا بالتنبؤ بشدة COVID -19. في هذا البحث، تم استخدام العديد من خوارزميات تقليل البيانات، وتم تدريب نماذج التعلم الآلي للتنبؤ بخطورة المرض باستخدام بيانات المرضى. أظهرت طريقة هندسية جديدة تعتمد على تحليل البيانات الطوبوغرافية تسمى تقريب وإسقاط المشعب الموحد (UMAP) أنها تحقق نتائج أفضل. تتمتع بدقة وخصوصية وحساسية 100 ٪ ومنحنى ROC في إجراء تنبؤ باستخدام مصنفات مختلفة للتعلم الآلي مثل X_GBoost و AdaBoost و Random Forest و ExtraTrees. يهدف النهج المقترح إلى مساعدة المستشفيات والمرافق الطبية في تحديد من يجب رؤيته أولاً ومن لديه أولوية أعلى لدخول المستشفى.Translated Description (French)
Résumé L'objectif de cette étude est de développer et de tester des modèles basés sur l'apprentissage automatique pour la prédiction de la gravité de la COVID-19. Les échantillons de test COVID-19 de 337 patients positifs au COVID-19 à l'hôpital Cheikh Zaid ont été regroupés en fonction de la gravité de leur maladie. La nôtre est la première étude à estimer la gravité de la maladie en combinant des données biologiques et non biologiques de patients atteints de COVID-19. De plus, l'utilisation de la ML à des fins thérapeutiques au Maroc est actuellement restreinte, et la nôtre est la première étude à étudier la gravité de la COVID-19. Lorsque des approches d'analyse de données ont été utilisées pour découvrir des modèles et des caractéristiques essentielles dans les données, il a été déterminé que la protéine C-réactive, les plaquettes et les D-dimères étaient les plus associés à la prédiction de la gravité de la COVID-19. Dans cette recherche, de nombreux algorithmes de réduction des données ont été utilisés et des modèles d'apprentissage automatique ont été formés pour prédire la gravité de la maladie à l'aide des données des patients. Une nouvelle méthode d'ingénierie des fonctionnalités basée sur l'analyse des données topologiques appelée Uniform Manifold Approximation and Projection (UMAP) a montré qu'elle obtenait de meilleurs résultats. Il a une précision, une spécificité, une sensibilité et une courbe roc de 100 % dans la réalisation d'une prédiction pronostique à l'aide de différents classificateurs d'apprentissage automatique tels que X_GBoost, AdaBoost, Random Forest et ExtraTrees. L'approche proposée vise à aider les hôpitaux et les établissements médicaux à déterminer qui doit être vu en premier et qui a une priorité plus élevée pour l'admission à l'hôpital.Translated Description (Spanish)
Resumen El propósito de este estudio es desarrollar y probar modelos basados en el aprendizaje automático para la predicción de la gravedad de COVID-19. Las muestras de prueba de COVID-19 de 337 pacientes positivos para COVID-19 en el Hospital Cheikh Zaid se agruparon de acuerdo con la gravedad de su enfermedad. El nuestro es el primer estudio que estima la gravedad de la enfermedad combinando datos biológicos y no biológicos de pacientes con COVID-19. Además, el uso de ML con fines terapéuticos en Marruecos está actualmente restringido, y el nuestro es el primer estudio que investiga la gravedad de COVID-19. Cuando se utilizaron enfoques de análisis de datos para descubrir patrones y características esenciales en los datos, se determinó que la proteína C reactiva, las plaquetas y los dímeros D eran los más asociados con la predicción de la gravedad de COVID-19. En esta investigación, se utilizaron muchos algoritmos de reducción de datos y se entrenaron modelos de aprendizaje automático para predecir la gravedad de la enfermedad utilizando datos de pacientes. Un nuevo método de ingeniería de características basado en el análisis de datos topológicos llamado Uniform Manifold Approximation and Projection (UMAP) demostró que logra mejores resultados. Tiene un 100% de precisión, especificidad, sensibilidad y curva Roc para realizar una predicción de pronóstico utilizando diferentes clasificadores de aprendizaje automático como X_GBoost, AdaBoost, Random Forest y ExtraTrees. El enfoque propuesto tiene como objetivo ayudar a los hospitales y centros médicos a determinar quién debe ser visto primero y quién tiene una mayor prioridad para el ingreso en el hospital.Files
s40537-021-00557-0.pdf
Files
(2.3 MB)
Name | Size | Download all |
---|---|---|
md5:9ee57ad66acd50b07632892dc4e89ab3
|
2.3 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- مناهج التعلم الآلي في التنبؤ بمخاطر كوفيد-19 الشديدة في المغرب
- Translated title (French)
- Approches d'apprentissage automatique dans la prédiction du risque de gravité de la Covid-19 au Maroc
- Translated title (Spanish)
- Enfoques de aprendizaje automático en la predicción del riesgo de gravedad de Covid-19 en Marruecos
Identifiers
- Other
- https://openalex.org/W4206105705
- DOI
- 10.1186/s40537-021-00557-0
References
- https://openalex.org/W1965309171
- https://openalex.org/W2051909961
- https://openalex.org/W2478708596
- https://openalex.org/W2518536270
- https://openalex.org/W2798105113
- https://openalex.org/W2804215412
- https://openalex.org/W2977322360
- https://openalex.org/W3001118548
- https://openalex.org/W3008090866
- https://openalex.org/W3008827533
- https://openalex.org/W3009875419
- https://openalex.org/W3010848803
- https://openalex.org/W3012054129
- https://openalex.org/W3012290165
- https://openalex.org/W3014048910
- https://openalex.org/W3014231150
- https://openalex.org/W3014289208
- https://openalex.org/W3014524604
- https://openalex.org/W3014789701
- https://openalex.org/W3015433395
- https://openalex.org/W3016404849
- https://openalex.org/W3017117984
- https://openalex.org/W3020077203
- https://openalex.org/W3021274772
- https://openalex.org/W3025160648
- https://openalex.org/W3025394897
- https://openalex.org/W3030357210
- https://openalex.org/W3032164206
- https://openalex.org/W3032510608
- https://openalex.org/W3032774217
- https://openalex.org/W3033217117
- https://openalex.org/W3033455483
- https://openalex.org/W3037163353
- https://openalex.org/W3038925693
- https://openalex.org/W3041463877
- https://openalex.org/W3041513237
- https://openalex.org/W3043040397
- https://openalex.org/W3046066086
- https://openalex.org/W3048479592
- https://openalex.org/W3049325061
- https://openalex.org/W3080880583
- https://openalex.org/W3082012811
- https://openalex.org/W3087434656
- https://openalex.org/W3088065558
- https://openalex.org/W3089352364
- https://openalex.org/W3090115387
- https://openalex.org/W3090687434
- https://openalex.org/W3091961237
- https://openalex.org/W3095451609
- https://openalex.org/W3095498961
- https://openalex.org/W3100945976
- https://openalex.org/W3102902405
- https://openalex.org/W3110902086
- https://openalex.org/W3112395022
- https://openalex.org/W3114071210
- https://openalex.org/W3117882517
- https://openalex.org/W3121120941
- https://openalex.org/W3121555817
- https://openalex.org/W3133377472
- https://openalex.org/W3135692744
- https://openalex.org/W3136592003
- https://openalex.org/W3144611861
- https://openalex.org/W3155812564
- https://openalex.org/W3161542193
- https://openalex.org/W3197782790
- https://openalex.org/W3199099752