Risk assessment of imported malaria in China: a machine learning perspective
Creators
- 1. National Institute for Parasitic Diseases
- 2. Hospital for Tropical Diseases
- 3. Vector (United States)
Description
Following China's official designation as malaria-free country by WHO, the imported malaria has emerged as a significant determinant impacting the malaria reestablishment within China. The objective of this study is to explore the application prospects of machine learning algorithms in imported malaria risk assessment of China.The data of imported malaria cases in China from 2011 to 2019 was provided by China CDC; historical epidemic data of malaria endemic country was obtained from World Malaria Report, and the other data used in this study are open access data. All the data processing and model construction based on R, and map visualization used ArcGIS software.A total of 27,088 malaria cases imported into China from 85 countries between 2011 and 2019. After data preprocessing and classification, clean dataset has 765 rows (85 * 9) and 11 cols. Six machine learning models was constructed based on the training set, and Random Forest model demonstrated the best performance in model evaluation. According to RF, the highest feature importance were the number of malaria deaths and Indigenous malaria cases. The RF model demonstrated high accuracy in forecasting risk for the year 2019, achieving commendable accuracy rate of 95.3%. This result aligns well with the observed outcomes, indicating the model's reliability in predicting risk levels.Machine learning algorithms have reliable application prospects in risk assessment of imported malaria in China. This study provides a new methodological reference for the risk assessment and control strategies adjusting of imported malaria in China.
Translated Descriptions
Translated Description (Arabic)
بعد تصنيف الصين رسميًا كدولة خالية من الملاريا من قبل منظمة الصحة العالمية، برزت الملاريا المستوردة كمحدد مهم يؤثر على إعادة انتشار الملاريا داخل الصين. الهدف من هذه الدراسة هو استكشاف آفاق تطبيق خوارزميات التعلم الآلي في تقييم مخاطر الملاريا المستوردة في الصين. تم توفير بيانات حالات الملاريا المستوردة في الصين من عام 2011 إلى عام 2019 من قبل مركز السيطرة على الأمراض في الصين ؛ تم الحصول على بيانات الوباء التاريخية للبلد الموبوء بالملاريا من تقرير الملاريا العالمي، والبيانات الأخرى المستخدمة في هذه الدراسة هي بيانات متاحة للجميع. استخدمت جميع معالجة البيانات وبناء النماذج بناءً على R، وتصور الخريطة برنامج ArcGIS. تم استيراد ما مجموعه 27,088 حالة ملاريا إلى الصين من 85 دولة بين عامي 2011 و 2019. بعد المعالجة المسبقة للبيانات وتصنيفها، تحتوي مجموعة البيانات النظيفة على 765 صفًا (85 * 9) و 11 عمودًا. تم بناء ستة نماذج للتعلم الآلي بناءً على مجموعة التدريب، وأظهر نموذج الغابة العشوائية أفضل أداء في تقييم النموذج. ووفقًا للاتحاد الدولي للملاريا، كان عدد الوفيات الناجمة عن الملاريا وحالات الملاريا لدى السكان الأصليين هو الأكثر أهمية. أظهر نموذج التردد اللاسلكي دقة عالية في التنبؤ بالمخاطر لعام 2019، حيث حقق معدل دقة جدير بالثناء قدره 95.3 ٪. تتوافق هذه النتيجة بشكل جيد مع النتائج الملحوظة، مما يشير إلى موثوقية النموذج في التنبؤ بمستويات المخاطر. تتمتع خوارزميات التعلم الآلي بآفاق تطبيق موثوقة في تقييم مخاطر الملاريا المستوردة في الصين. توفر هذه الدراسة مرجعًا منهجيًا جديدًا لتقييم المخاطر واستراتيجيات التحكم في تعديل الملاريا المستوردة في الصين.Translated Description (French)
Suite à la désignation officielle de la Chine comme pays exempt de paludisme par l'OMS, le paludisme importé est apparu comme un déterminant important AYANT un impact sur le rétablissement du paludisme en Chine. L'objectif de cette étude est d'explorer les perspectives d'application des algorithmes d'apprentissage automatique dans l'évaluation des risques de paludisme importés de Chine. Les données des cas de paludisme importés en Chine de 2011 à 2019 ont été fournies par les CDC de Chine ; les données épidémiques historiques du pays endémique du paludisme ont été obtenues à partir du World Malaria Report, et les autres données utilisées dans cette étude sont des données en libre accès. Tous les traitements de données et la construction de modèles basés sur R et la visualisation de cartes ont utilisé le logiciel ArcGIS. Au total, 27 088 cas de paludisme ont été importés en Chine de 85 pays entre 2011 et 2019. Après le prétraitement et la classification des données, l'ensemble de données propre comporte 765 lignes (85 * 9) et 11 colonnes. Six modèles d'apprentissage automatique ont été construits sur la base de l'ensemble de formation, et le modèle Random Forest a démontré les meilleures performances dans l'évaluation du modèle. Selon RF, la caractéristique la plus importante était le nombre de décès dus au paludisme et de cas de paludisme chez les autochtones. Le modèle RF a démontré une grande précision dans la prévision des risques pour l'année 2019, atteignant un taux de précision louable de 95,3 %. Ce résultat s'aligne bien sur les résultats observés, indiquant la fiabilité du modèle dans la prédiction des niveaux de risque. Les algorithmes d'apprentissage automatique ont des perspectives d'application fiables dans l'évaluation des risques de paludisme importé en Chine. Cette étude fournit une nouvelle référence méthodologique pour l'évaluation des risques et l'ajustement des stratégies de contrôle du paludisme importé en Chine.Translated Description (Spanish)
Tras la designación oficial de China como país libre de malaria por la OMS, la malaria importada se ha convertido en un determinante importante que afecta el restablecimiento de la malaria dentro de China. El objetivo de este estudio es explorar las perspectivas de aplicación de los algoritmos de aprendizaje automático en la evaluación del riesgo de malaria importada de China. Los datos de los casos de malaria importados en China de 2011 a 2019 fueron proporcionados por los CDC de China; los datos históricos de la epidemia del país endémico de malaria se obtuvieron del World Malaria Report, y los otros datos utilizados en este estudio son datos de acceso abierto. Todo el procesamiento de datos y la construcción de modelos basados en R, y la visualización de mapas utilizaron el software ArcGIS. Un total de 27.088 casos de malaria importados a China desde 85 países entre 2011 y 2019. Después del preprocesamiento y la clasificación de los datos, el conjunto de datos limpio tiene 765 filas (85 * 9) y 11 columnas. Se construyeron seis modelos de aprendizaje automático basados en el conjunto de capacitación, y el modelo de bosque aleatorio demostró el mejor rendimiento en la evaluación del modelo. Según RF, la mayor importancia de la característica fue el número de muertes por malaria y los casos de malaria indígena. El modelo de RF demostró una alta precisión en el riesgo de pronóstico para el año 2019, logrando una tasa de precisión encomiable del 95,3%. Este resultado se alinea bien con los resultados observados, lo que indica la confiabilidad del modelo para predecir los niveles de riesgo. Los algoritmos de aprendizaje automático tienen perspectivas de aplicación confiables en la evaluación del riesgo de malaria importada en China. Este estudio proporciona una nueva referencia metodológica para la evaluación de riesgos y el ajuste de las estrategias de control de la malaria importada en China.Files
s12889-024-17929-9.pdf
Files
(2.9 MB)
Name | Size | Download all |
---|---|---|
md5:30db3d4f12d51ed1c07115736a92e076
|
2.9 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- تقييم مخاطر الملاريا المستوردة في الصين: منظور التعلم الآلي
- Translated title (French)
- Évaluation des risques du paludisme importé en Chine : une perspective d'apprentissage automatique
- Translated title (Spanish)
- Evaluación del riesgo de malaria importada en China: una perspectiva de aprendizaje automático
Identifiers
- Other
- https://openalex.org/W4392984837
- DOI
- 10.1186/s12889-024-17929-9
References
- https://openalex.org/W2023265744
- https://openalex.org/W2064186732
- https://openalex.org/W2095649738
- https://openalex.org/W2100788563
- https://openalex.org/W2132424470
- https://openalex.org/W2210003893
- https://openalex.org/W2261059368
- https://openalex.org/W2287700281
- https://openalex.org/W2291966448
- https://openalex.org/W2726594598
- https://openalex.org/W2743680082
- https://openalex.org/W2888919795
- https://openalex.org/W2906484232
- https://openalex.org/W2927032858
- https://openalex.org/W2932104007
- https://openalex.org/W2940010972
- https://openalex.org/W2973871066
- https://openalex.org/W2985629346
- https://openalex.org/W2995098893
- https://openalex.org/W2996573966
- https://openalex.org/W3019131001
- https://openalex.org/W3025161810
- https://openalex.org/W3091943846
- https://openalex.org/W3102476541
- https://openalex.org/W3107404799
- https://openalex.org/W3109046922
- https://openalex.org/W3135415447
- https://openalex.org/W3153083594
- https://openalex.org/W3165179377
- https://openalex.org/W3202435008
- https://openalex.org/W4210664948
- https://openalex.org/W4235312475
- https://openalex.org/W4254043352
- https://openalex.org/W4280518374
- https://openalex.org/W4285019461
- https://openalex.org/W4285611320
- https://openalex.org/W4309047126
- https://openalex.org/W4311021231
- https://openalex.org/W4311577544
- https://openalex.org/W4312742163
- https://openalex.org/W4366831037