Published January 1, 2024 | Version v1
Publication Open

Interpretable Machine Learning Approaches for Forecasting and Predicting Air Pollution: A Systematic Review

  • 1. Université Mohammed VI des Sciences de la Santé
  • 2. Economic & Social Sciences, Health Systems & Medical Informatics
  • 3. Inserm
  • 4. Direction de la Météorologie Nationale
  • 5. Jordan University of Science and Technology
  • 6. Mohammed V University

Description

Many studies use machine learning to predict atmospheric pollutant levels, prioritizing accuracy over interpretability. This systematic review will focus on reviewing studies that have utilized interpretable machine learning models to enhance interpretability while maintaining high accuracy for air pollution prediction. The search terms "air pollution," "machine learning," and "interpretability" were used to identify relevant studies published between 2011 and 2023 from PubMed, Scopus, Web of Science, Science Direct, and JuSER. The included studies were assessed for quality based on an ecological checklist for maximizing reproducibility of ecological niche models. Among the 5,396 identified studies, 480 focused on air pollution prediction, with 56 providing model interpretations. Among the studies, 20 methods were identified: 8 model-agnostic methods, 4 model-specific methods, and 8 hybrid models. Shapley additive explanations was the most commonly used method (46.4%), followed by partial dependence plots (17.4%), both of which are model-agnostic methods. These methods identify important atmospheric features, enhancing researchers' understanding and making machine learning outcomes more accessible to non-experts. This can enhance prediction and prevention of adverse weather events and air pollution, benefiting public health.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تستخدم العديد من الدراسات التعلم الآلي للتنبؤ بمستويات الملوثات الجوية، مع إعطاء الأولوية للدقة على قابلية التفسير. ستركز هذه المراجعة المنهجية على مراجعة الدراسات التي استخدمت نماذج التعلم الآلي القابلة للتفسير لتعزيز قابلية التفسير مع الحفاظ على دقة عالية للتنبؤ بتلوث الهواء. تم استخدام مصطلحات البحث "تلوث الهواء" و "التعلم الآلي" و "قابلية التفسير" لتحديد الدراسات ذات الصلة المنشورة بين عامي 2011 و 2023 من PubMed و Scopus و Web of Science و Science Direct و JuSER. تم تقييم الدراسات المدرجة من حيث الجودة بناءً على قائمة مرجعية بيئية لزيادة قابلية استنساخ النماذج البيئية المتخصصة إلى أقصى حد. من بين 5396 دراسة تم تحديدها، ركزت 480 دراسة على التنبؤ بتلوث الهواء، مع 56 دراسة تقدم تفسيرات نموذجية. من بين الدراسات، تم تحديد 20 طريقة: 8 طرق لا تعتمد على النماذج، و 4 طرق خاصة بالنماذج، و 8 نماذج هجينة. كانت التفسيرات المضافة لشابلي هي الطريقة الأكثر استخدامًا (46.4 ٪)، تليها مخططات الاعتماد الجزئي (17.4 ٪)، وكلاهما طرق لا تعتمد على النموذج. تحدد هذه الأساليب الميزات الجوية المهمة، مما يعزز فهم الباحثين ويجعل نتائج التعلم الآلي في متناول غير الخبراء. وهذا يمكن أن يعزز التنبؤ بالظواهر الجوية الضارة وتلوث الهواء والوقاية منها، مما يفيد الصحة العامة.

Translated Description (French)

De nombreuses études utilisent l'apprentissage automatique pour prédire les niveaux de polluants atmosphériques, en privilégiant la précision par rapport à l'interprétabilité. Cette revue systématique se concentrera sur l'examen des études qui ont utilisé des modèles d'apprentissage automatique interprétables pour améliorer l'interprétabilité tout en maintenant une grande précision pour la prédiction de la pollution atmosphérique. Les termes de recherche « pollution de l'air », « apprentissage automatique » et « interprétabilité » ont été utilisés pour identifier les études pertinentes publiées entre 2011 et 2023 par PubMed, Scopus, Web of Science, Science Direct et JuSER. La qualité des études incluses a été évaluée sur la base d'une liste de contrôle écologique visant à maximiser la reproductibilité des modèles de niche écologiques. Parmi les 5 396 études identifiées, 480 se sont concentrées sur la prédiction de la pollution atmosphérique, 56 fournissant des interprétations de modèles. Parmi les études, 20 méthodes ont été identifiées : 8 méthodes modèles-agnostiques, 4 méthodes modèles-spécifiques et 8 modèles hybrides. Les explications additives de Shapley étaient la méthode la plus couramment utilisée (46,4 %), suivies des courbes de dépendance partielle (17,4 %), qui sont toutes deux des méthodes indépendantes du modèle. Ces méthodes identifient les caractéristiques atmosphériques importantes, améliorant la compréhension des chercheurs et rendant les résultats de l'apprentissage automatique plus accessibles aux non-experts. Cela peut améliorer la prédiction et la prévention des événements météorologiques défavorables et de la pollution de l'air, au profit de la santé publique.

Translated Description (Spanish)

Muchos estudios utilizan el aprendizaje automático para predecir los niveles de contaminantes atmosféricos, priorizando la precisión sobre la interpretabilidad. Esta revisión sistemática se centrará en la revisión de estudios que han utilizado modelos de aprendizaje automático interpretables para mejorar la interpretabilidad mientras se mantiene una alta precisión para la predicción de la contaminación del aire. Los términos de búsqueda "contaminación del aire", "aprendizaje automático" e "interpretabilidad" se utilizaron para identificar estudios relevantes publicados entre 2011 y 2023 de PubMed, Scopus, Web of Science, Science Direct y JuSER. La calidad de los estudios incluidos se evaluó en función de una lista de verificación ecológica para maximizar la reproducibilidad de los modelos de nicho ecológicos. Entre los 5.396 estudios identificados, 480 se centraron en la predicción de la contaminación del aire, y 56 proporcionaron interpretaciones de modelos. Entre los estudios, se identificaron 20 métodos: 8 métodos independientes del modelo, 4 métodos específicos del modelo y 8 modelos híbridos. Las explicaciones aditivas de Shapley fueron el método más utilizado (46,4%), seguido de los gráficos de dependencia parcial (17,4%), ambos métodos independientes del modelo. Estos métodos identifican características atmosféricas importantes, mejoran la comprensión de los investigadores y hacen que los resultados del aprendizaje automático sean más accesibles para los no expertos. Esto puede mejorar la predicción y prevención de eventos climáticos adversos y la contaminación del aire, lo que beneficia la salud pública.

Files

aaqr-23-06-oa-0151.pdf.pdf

Files (885.5 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:487cf510433dd2b968a39a1851bcdd09
885.5 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
مناهج التعلم الآلي القابلة للتفسير للتنبؤ والتنبؤ بتلوث الهواء: مراجعة منهجية
Translated title (French)
Approches interprétables d'apprentissage automatique pour la prévision et la prévision de la pollution de l'air : un examen systématique
Translated title (Spanish)
Enfoques interpretables de aprendizaje automático para pronosticar y predecir la contaminación del aire: una revisión sistemática

Identifiers

Other
https://openalex.org/W4389198718
DOI
10.4209/aaqr.230151

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Jordan