Comparative Analysis of Deep Learning and Statistical Models for Air Pollutants Prediction in Urban Areas
Creators
- 1. Queen's University Belfast
- 2. Norwegian Institute for Air Research
- 3. Thuyloi University
- 4. Duy Tan University
Description
Rapid growth in urbanization and industrialization leads to an increase in air pollution and poor air quality.Because of its adverse effects on the natural environment and human health, it's been declared a "silent public health emergency".To deal with this global challenge, accurate prediction of air pollution is important for stakeholders to take required actions.In recent years, deep learning-based forecasting models show promise for more effective and efficient forecasting of air quality than other approaches.In this study, we made a comparative analysis of various deep learning-based single-step forecasting models such as long short term memory (LSTM), gated recurrent unit (GRU), and a statistical model to predict five air pollutants namely Nitrogen Dioxide (NO 2 ), Ozone (O 3 ), Sulphur Dioxide (SO 2 ), and Particulate Matter (PM2.5, and PM10).For empirical evaluation, we used a publicly available dataset collected in Northern Ireland, using an air quality monitoring station situated in Belfast city centre.It measures the concentration of air pollutants.The performance of forecasting models is evaluated based on three performance metrics: (a) root mean square error (RMSE), (b) mean absolute error (MAE) and (c) R-squared (R 2 ).The result shows that deep learning models consistently achieved the least RMSE compared to the statistical models with a value of 0.59.In addition, the deep learning model is also found to have the highest R 2 score of 0.856.
Translated Descriptions
Translated Description (Arabic)
النمو السريع في التحضر والتصنيع يؤدي إلى زيادة في تلوث الهواء وسوء جودة الهواء. بسبب آثاره الضارة على البيئة الطبيعية وصحة الإنسان، تم إعلانه "حالة طوارئ صحية عامة صامتة". للتعامل مع هذا التحدي العالمي، يعد التنبؤ الدقيق بتلوث الهواء أمرًا مهمًا لأصحاب المصلحة لاتخاذ الإجراءات المطلوبة. في السنوات الأخيرة، تظهر نماذج التنبؤ القائمة على التعلم العميق توقعات أكثر فعالية وكفاءة لجودة الهواء من النهج الأخرى. في هذه الدراسة، أجرينا تحليلًا مقارنًا لمختلف نماذج التنبؤ ذات الخطوة الواحدة القائمة على التعلم العميق مثل الذاكرة قصيرة المدى (LSTM)، والوحدة المتكررة المسورة (GRU)، ونموذج إحصائي للتنبؤ بخمسة ملوثات هواء وهي ثاني أكسيد النيتروجين (NO 2 )، والأوزون (O 3 )، وثاني أكسيد الكبريت (SO 2 )، والمادة الجسيمية (PM2.5، و PM10). للتقييم التجريبي، استخدمنا مجموعة بيانات متاحة للجمهور تم جمعها في أيرلندا الشمالية، باستخدام محطة مراقبة جودة الهواء الموجودة في وسط مدينة بلفاست. يقيس تركيز ملوثات الهواء. يتم تقييم أداء نماذج التنبؤ بناءً على ثلاثة مقاييس للأداء: (أ) الجذر متوسط الخطأ المربع (RMSE)، (ب) متوسط الخطأ المطلق (MAE) و (ج) R - squared (R 2 ). تظهر النتيجة أن نماذج التعلم العميق حققت باستمرار أقل RMSE مقارنة بالنماذج الإحصائية بقيمة 0.59. بالإضافة إلى ذلك، وجد أيضًا أن نموذج التعلم العميق لديه أعلى درجة R 2 تبلغ 0.856.Translated Description (French)
La croissance rapide de l'urbanisation et de l'industrialisation entraîne une augmentation de la pollution de l'air et une mauvaise qualité de l'air. En raison de ses effets néfastes sur l'environnement naturel et la santé humaine, elle a été déclarée « urgence silencieuse de santé publique ». Pour faire face à ce défi mondial, il est important que les parties prenantes prennent les mesures nécessaires pour prévoir avec précision la pollution de l'air. Au cours des dernières années, les modèles de prévision basés sur l'apprentissage en profondeur sont prometteurs pour une prévision de la qualité de l'air plus efficace et efficiente que d'autres approches. Dans cette étude, nous avons effectué une analyse comparative de divers modèles de prévision en une seule étape basés sur l'apprentissage en profondeur, tels que mémoire à court terme (LSTM), unité récurrente fermée (GRU) et un modèle statistique pour prédire cinq polluants atmosphériques, à savoir le dioxyde d'azote (NO 2 ), l'ozone (O 3), le dioxyde de soufre (SO 2) et les particules (PM2,5 et PM10). Pour l'évaluation empirique, nous avons utilisé un ensemble de données accessibles au public recueillies en Irlande du Nord, à l'aide d'une station de surveillance de la qualité de l'air située dans le centre-ville de Belfast. Elle mesure la concentration de polluants atmosphériques. La performance des modèles de prévision est évaluée en fonction de trois paramètres de performance : (a) racine erreur quadratique moyenne (RMSE), (b) erreur absolue moyenne (MAE) et (c) R-carré (R 2 ). Le résultat montre que les modèles d'apprentissage profond ont systématiquement obtenu le moins de RMSE par rapport aux modèles statistiques avec une valeur de 0,59. En outre, le modèle d'apprentissage profond s'avère également avoir le score R 2 le plus élevé de 0,856.Translated Description (Spanish)
El rápido crecimiento de la urbanización y la industrialización conduce a un aumento de la contaminación del aire y a una mala calidad del aire. Debido a sus efectos adversos sobre el medio ambiente natural y la salud humana, se ha declarado una "emergencia silenciosa de salud pública". Para hacer frente a este desafío global, es importante que las partes interesadas tomen las medidas necesarias para predecir con precisión la contaminación del aire. En los últimos años, los modelos de pronóstico basados en el aprendizaje profundo son prometedores para pronosticar la calidad del aire de manera más efectiva y eficiente que otros enfoques. En este estudio, hicimos un análisis comparativo de varios modelos de pronóstico de un solo paso basados en el aprendizaje profundo, como los modelos memoria a corto plazo (LSTM), unidad recurrente cerrada (Gru) y un modelo estadístico para predecir cinco contaminantes atmosféricos, a saber, dióxido de nitrógeno (NO 2 ), ozono (O 3 ), dióxido de azufre (SO 2) y materia particulada (PM2.5 y PM10). Para la evaluación empírica, utilizamos un conjunto de datos disponibles públicamente recopilados en Irlanda del Norte, utilizando una estación de monitoreo de la calidad del aire situada en el centro de la ciudad de Belfast. Mide la concentración de contaminantes atmosféricos. El rendimiento de los modelos de pronóstico se evalúa en función de tres métricas de rendimiento: (a) raíz error cuadrático medio (RMSE), (b) error absoluto medio (MAE) y (c) R-cuadrado (R 2 ). El resultado muestra que los modelos de aprendizaje profundo lograron consistentemente el menor RMSE en comparación con los modelos estadísticos con un valor de 0.59. Además, el modelo de aprendizaje profundo también tiene la puntuación R 2 más alta de 0.856.Files
10160020.pdf.pdf
Files
(245 Bytes)
Name | Size | Download all |
---|---|---|
md5:caa871f6ca20f1d4e22f0b7d935f9503
|
245 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- التحليل المقارن للتعلم العميق والنماذج الإحصائية للتنبؤ بملوثات الهواء في المناطق الحضرية
- Translated title (French)
- Analyse comparative de l'apprentissage approfondi et des modèles statistiques pour la prévision des polluants atmosphériques dans les zones urbaines
- Translated title (Spanish)
- Análisis comparativo de modelos estadísticos y de aprendizaje profundo para la predicción de contaminantes atmosféricos en áreas urbanas
Identifiers
- Other
- https://openalex.org/W4381884147
- DOI
- 10.1109/access.2023.3289153
References
- https://openalex.org/W1995655017
- https://openalex.org/W2036455044
- https://openalex.org/W2064675550
- https://openalex.org/W2157331557
- https://openalex.org/W2551234371
- https://openalex.org/W2556522401
- https://openalex.org/W2767895109
- https://openalex.org/W2914477964
- https://openalex.org/W2943201207
- https://openalex.org/W2945810026
- https://openalex.org/W2952265495
- https://openalex.org/W2955092811
- https://openalex.org/W2955613755
- https://openalex.org/W2981685989
- https://openalex.org/W2990955039
- https://openalex.org/W3007246056
- https://openalex.org/W3027059498
- https://openalex.org/W3029326408
- https://openalex.org/W3033154016
- https://openalex.org/W3037692731
- https://openalex.org/W3108376771
- https://openalex.org/W3115103108
- https://openalex.org/W4200026345
- https://openalex.org/W4221017455
- https://openalex.org/W4306882681
- https://openalex.org/W4310510932
- https://openalex.org/W4315783729