Published January 1, 2022 | Version v1
Publication

On the implementation of a new version of the Weibull distribution and machine learning approach to model the COVID-19 data

  • 1. Communication University of China
  • 2. Yazd University
  • 3. Pakistan Institute of Development Economics
  • 4. Future University in Egypt
  • 5. Quaid-i-Azam University
  • 6. Prince Sattam Bin Abdulaziz University
  • 7. Mansoura University

Description

Statistical methodologies have broader applications in almost every sector of life including education, hydrology, reliability, management, and healthcare sciences. Among these sectors, statistical modeling and predicting data in the healthcare sector is very crucial. In this paper, we introduce a new method, namely, a new extended exponential family to update the distributional flexibility of the existing models. Based on this approach, a new version of the Weibull model, namely, a new extended exponential Weibull model is introduced. The applicability of the new extended exponential Weibull model is shown by considering two data sets taken from the health sciences. The first data set represents the mortality rate of the patients infected by the coronavirus disease 2019 (COVID-19) in Mexico. Whereas, the second set represents the mortality rate of COVID-19 patients in Holland. Utilizing the same data sets, we carry out forecasting using three machine learning (ML) methods including support vector regression (SVR), random forest (RF), and neural network autoregression (NNAR). To assess their forecasting performances, two statistical accuracy measures, namely, root mean square error (RMSE) and mean absolute error (MAE) are considered. Based on our findings, it is observed that the RF algorithm is very effective in predicting the death rate of the COVID-19 data in Mexico. Whereas, for the second data, the SVR performs better as compared to the other methods.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

للمنهجيات الإحصائية تطبيقات أوسع في كل قطاع من قطاعات الحياة تقريبًا بما في ذلك التعليم والهيدرولوجيا والموثوقية والإدارة وعلوم الرعاية الصحية. من بين هذه القطاعات، تعد النمذجة الإحصائية والتنبؤ بالبيانات في قطاع الرعاية الصحية أمرًا بالغ الأهمية. في هذه الورقة، نقدم طريقة جديدة، وهي عائلة أسية موسعة جديدة لتحديث المرونة التوزيعية للنماذج الحالية. بناءً على هذا النهج، يتم تقديم إصدار جديد من نموذج Weibull، وهو نموذج Weibull الأسي الموسع الجديد. يتم توضيح قابلية تطبيق نموذج Weibull الأسي الموسع الجديد من خلال النظر في مجموعتين من البيانات المأخوذة من العلوم الصحية. تمثل مجموعة البيانات الأولى معدل وفيات المرضى المصابين بمرض فيروس كورونا 2019 (COVID -19) في المكسيك. بينما تمثل المجموعة الثانية معدل وفيات مرضى كوفيد-19 في هولندا. باستخدام نفس مجموعات البيانات، نقوم بالتنبؤ باستخدام ثلاث طرق للتعلم الآلي (ML) بما في ذلك انحدار متجه الدعم (SVR) والغابة العشوائية (RF) والانحدار التلقائي للشبكة العصبية (NNAR). لتقييم أداء التنبؤ، يتم النظر في اثنين من مقاييس الدقة الإحصائية، وهما متوسط الخطأ التربيعي الجذري (RMSE) ومتوسط الخطأ المطلق (MAE). بناءً على النتائج التي توصلنا إليها، لوحظ أن خوارزمية التردد اللاسلكي فعالة للغاية في التنبؤ بمعدل وفيات بيانات COVID -19 في المكسيك. بينما، بالنسبة للبيانات الثانية، يكون أداء SVR أفضل مقارنة بالطرق الأخرى.

Translated Description (French)

Les méthodologies statistiques ont des applications plus larges dans presque tous les secteurs de la vie, y compris l'éducation, l'hydrologie, la fiabilité, la gestion et les sciences de la santé. Parmi ces secteurs, la modélisation statistique et la prévision des données dans le secteur de la santé sont très cruciales. Dans cet article, nous introduisons une nouvelle méthode, à savoir une nouvelle famille exponentielle étendue pour mettre à jour la flexibilité distributionnelle des modèles existants. Sur la base de cette approche, une nouvelle version du modèle de Weibull, à savoir un nouveau modèle de Weibull exponentiel étendu, est introduite. L'applicabilité du nouveau modèle de Weibull exponentiel étendu est montrée en considérant deux ensembles de données tirés des sciences de la santé. Le premier ensemble de données représente le taux de mortalité des patients infectés par la maladie à coronavirus 2019 (COVID-19) au Mexique. ATTENDU que, le deuxième ensemble représente le taux de mortalité des patients atteints de COVID-19 en Hollande. En utilisant les mêmes ensembles de données, nous effectuons des prévisions à l'aide de trois méthodes d'apprentissage automatique (ML), notamment la régression vectorielle de support (SVR), la forêt aléatoire (RF) et l'autorégression de réseau neuronal (NNAR). Pour évaluer leurs performances de prévision, deux mesures de précision statistique, à savoir, l'erreur quadratique moyenne (RMSE) et l'erreur absolue moyenne (MAE) sont considérées. Sur la base de nos résultats, il est observé que l'algorithme RF est très efficace pour prédire le taux de mortalité des données COVID-19 au Mexique. Alors que, pour les deuxièmes données, le SVR est plus performant par rapport aux autres méthodes.

Translated Description (Spanish)

Las metodologías estadísticas tienen aplicaciones más amplias en casi todos los sectores de la vida, incluyendo la educación, la hidrología, la fiabilidad, la gestión y las ciencias de la salud. Entre estos sectores, la modelización estadística y la predicción de datos en el sector sanitario es muy crucial. En este artículo, presentamos un nuevo método, a saber, una nueva familia exponencial extendida para actualizar la flexibilidad distributiva de los modelos existentes. En base a este enfoque, se introduce una nueva versión del modelo de Weibull, a saber, un nuevo modelo exponencial extendido de Weibull. La aplicabilidad del nuevo modelo exponencial extendido de Weibull se muestra considerando dos conjuntos de datos tomados de las ciencias de la salud. El primer conjunto de datos representa la tasa de mortalidad de los pacientes infectados por la enfermedad del coronavirus 2019 (COVID-19) en México. Considerando que, el segundo conjunto representa la tasa de mortalidad de los pacientes con COVID-19 en Holanda. Utilizando los mismos conjuntos de datos, llevamos a cabo pronósticos utilizando tres métodos de aprendizaje automático (ML) que incluyen regresión vectorial de soporte (SVR), bosque aleatorio (RF) y autorregresión de redes neuronales (NNAR). Para evaluar sus rendimientos de pronóstico, se consideran dos medidas de precisión estadística, a saber, el error cuadrático medio (RMSE) y el error absoluto medio (MAE). Con base en nuestros hallazgos, se observa que el algoritmo de RF es muy efectivo para predecir la tasa de mortalidad de los datos de COVID-19 en México. Considerando que, para los segundos datos, el SVR funciona mejor en comparación con los otros métodos.

Additional details

Additional titles

Translated title (Arabic)
بشأن تنفيذ نسخة جديدة من نهج Weibull للتوزيع والتعلم الآلي لنمذجة بيانات COVID -19
Translated title (French)
Sur la mise en œuvre d'une nouvelle version de l'approche de distribution et d'apprentissage automatique de Weibull pour modéliser les données COVID-19
Translated title (Spanish)
Sobre la implementación de una nueva versión del enfoque de distribución y aprendizaje automático de Weibull para modelar los datos de COVID-19

Identifiers

Other
https://openalex.org/W4312969476
DOI
10.3934/mbe.2023016

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Egypt

References

  • https://openalex.org/W1534477342
  • https://openalex.org/W1964366808
  • https://openalex.org/W2003457432
  • https://openalex.org/W2039935421
  • https://openalex.org/W2485892197
  • https://openalex.org/W2806767231
  • https://openalex.org/W2911964244
  • https://openalex.org/W2975378403
  • https://openalex.org/W2989166075
  • https://openalex.org/W3015658132
  • https://openalex.org/W3022714712
  • https://openalex.org/W3023648686
  • https://openalex.org/W3025352604
  • https://openalex.org/W3029330941
  • https://openalex.org/W3032927513
  • https://openalex.org/W3049548738
  • https://openalex.org/W3080723525
  • https://openalex.org/W3088565218
  • https://openalex.org/W3090161142
  • https://openalex.org/W3092823782
  • https://openalex.org/W3118018179
  • https://openalex.org/W3134296930
  • https://openalex.org/W3134916257
  • https://openalex.org/W3138559289
  • https://openalex.org/W3177299149
  • https://openalex.org/W3211265568
  • https://openalex.org/W3212597074
  • https://openalex.org/W4200466899
  • https://openalex.org/W4226146575
  • https://openalex.org/W4239510810
  • https://openalex.org/W4285197185