Integrating gated recurrent unit in graph neural network to improve infectious disease prediction: an attempt
- 1. Beijing University of Technology
- 2. Chinese Center For Disease Control and Prevention
- 3. National Institute for Viral Disease Control and Prevention
Description
Objective This study focuses on enhancing the precision of epidemic time series data prediction by integrating Gated Recurrent Unit (GRU) into a Graph Neural Network (GNN), forming the GRGNN. The accuracy of the GNN (Graph Neural Network) network with introduced GRU (Gated Recurrent Units) is validated by comparing it with seven commonly used prediction methods. Method The GRGNN methodology involves multivariate time series prediction using a GNN (Graph Neural Network) network improved by the integration of GRU (Gated Recurrent Units). Additionally, Graphical Fourier Transform (GFT) and Discrete Fourier Transform (DFT) are introduced. GFT captures inter-sequence correlations in the spectral domain, while DFT transforms data from the time domain to the frequency domain, revealing temporal node correlations. Following GFT and DFT, outbreak data are predicted through one-dimensional convolution and gated linear regression in the frequency domain, graph convolution in the spectral domain, and GRU (Gated Recurrent Units) in the time domain. The inverse transformation of GFT and DFT is employed, and final predictions are obtained after passing through a fully connected layer. Evaluation is conducted on three datasets: the COVID-19 datasets of 38 African countries and 42 European countries from worldometers, and the chickenpox dataset of 20 Hungarian regions from Kaggle. Metrics include Average Root Mean Square Error (ARMSE) and Average Mean Absolute Error (AMAE). Result For African COVID-19 dataset and Hungarian Chickenpox dataset, GRGNN consistently outperforms other methods in ARMSE and AMAE across various prediction step lengths. Optimal results are achieved even at extended prediction steps, highlighting the model's robustness. Conclusion GRGNN proves effective in predicting epidemic time series data with high accuracy, demonstrating its potential in epidemic surveillance and early warning applications. However, further discussions and studies are warranted to refine its application and judgment methods, emphasizing the ongoing need for exploration and research in this domain.
Translated Descriptions
Translated Description (Arabic)
الهدف تركز هذه الدراسة على تعزيز دقة التنبؤ ببيانات السلاسل الزمنية الوبائية من خلال دمج الوحدة المتكررة المسورة (GRU) في شبكة عصبية بيانية (GNN)، مما يشكل GRGNN. يتم التحقق من دقة شبكة GNN (الشبكة العصبية للرسم البياني) مع GRU المقدمة (الوحدات المتكررة ذات البوابات) من خلال مقارنتها بسبع طرق تنبؤ شائعة الاستخدام. الطريقة تتضمن منهجية GRGNN التنبؤ بالسلاسل الزمنية متعددة المتغيرات باستخدام شبكة GNN (الشبكة العصبية للرسم البياني) التي تم تحسينها من خلال دمج GRU (الوحدات المتكررة ذات البوابات). بالإضافة إلى ذلك، يتم تقديم تحويل فوريير الرسومي (GFT) وتحويل فوريير المنفصل (DFT). يلتقط GFT ارتباطات التسلسل البيني في المجال الطيفي، بينما يحول DFT البيانات من المجال الزمني إلى مجال التردد، مما يكشف عن ارتباطات العقدة الزمنية. بعد GFT و DFT، يتم التنبؤ ببيانات التفشي من خلال الالتفاف أحادي البعد والانحدار الخطي المسور في مجال التردد، والتفاف الرسم البياني في المجال الطيفي، و GRU (الوحدات المتكررة المسورة) في المجال الزمني. يتم استخدام التحويل العكسي لـ GFT و DFT، ويتم الحصول على التنبؤات النهائية بعد المرور عبر طبقة متصلة بالكامل. يتم إجراء التقييم على ثلاث مجموعات بيانات: مجموعات بيانات COVID -19 لـ 38 دولة أفريقية و 42 دولة أوروبية من مقاييس العالم، ومجموعة بيانات جدري الماء لـ 20 منطقة مجرية من Kaggle. تشمل المقاييس متوسط متوسط الخطأ التربيعي (ARMSE) ومتوسط الخطأ المطلق (AMAE). بالنسبة لمجموعة بيانات كوفيد-19 الأفريقية ومجموعة بيانات جدري الماء المجري، تتفوق GRGNN باستمرار على الطرق الأخرى في ARMSE و AMAE عبر أطوال خطوات التنبؤ المختلفة. يتم تحقيق النتائج المثلى حتى في خطوات التنبؤ الممتدة، مما يسلط الضوء على متانة النموذج. الاستنتاج تثبت GRGNN فعاليتها في التنبؤ ببيانات السلاسل الزمنية للوباء بدقة عالية، مما يدل على إمكاناتها في مراقبة الأوبئة وتطبيقات الإنذار المبكر. ومع ذلك، هناك ما يبرر إجراء مزيد من المناقشات والدراسات لتحسين تطبيقه وطرق الحكم عليه، مع التأكيد على الحاجة المستمرة للاستكشاف والبحث في هذا المجال.Translated Description (French)
Objectif Cette étude se concentre sur l'amélioration de la précision de la prédiction des données des séries temporelles épidémiques en intégrant l'unité récurrente fermée (GRU) dans un réseau neuronal graphique (GNN), formant le GRGNN. La précision du réseau GNN (Graph Neural Network) avec les GRU (Gated Recurrent Units) introduits est validée en le comparant à sept méthodes de prédiction couramment utilisées. Méthode La méthodologie GRGNN implique la prédiction de séries temporelles multivariées à l'aide d'un réseau GNN (Graph Neural Network) amélioré par l'intégration de GRU (Gated Recurrent Units). En outre, la transformation de Fourier graphique (GFT) et la transformation de Fourier discrète (DFT) sont introduites. GFT capture les corrélations inter-séquences dans le domaine spectral, tandis que DFT transforme les données du domaine temporel au domaine fréquentiel, révélant les corrélations de nœuds temporels. Après GFT et DFT, les données sur les épidémies sont prédites par convolution unidimensionnelle et régression linéaire commandée dans le domaine fréquentiel, convolution de graphe dans le domaine spectral et GRU (unités récurrentes commandées) dans le domaine temporel. La transformation inverse de la GFT et de la DFT est utilisée, et les prédictions finales sont obtenues après avoir traversé une couche entièrement connectée. L'évaluation est menée sur trois ensembles de données : les ensembles de données COVID-19 de 38 pays africains et de 42 pays européens à partir de worldometers, et l'ensemble de données sur la varicelle de 20 régions hongroises de Kaggle. Les mesures comprennent l'erreur quadratique moyenne (ARMSE) et l'erreur absolue moyenne (AMAE). Résultat Pour l'ensemble de données sur le COVID-19 en Afrique et l'ensemble de données sur la varicelle en Hongrie, GRGNN surpasse constamment les autres méthodes de l'ARMSE et de l'AMAE à travers diverses longueurs d'étapes de prédiction. Des résultats optimaux sont obtenus même à des étapes de prédiction étendues, mettant en évidence la robustesse du modèle. Conclusion GRGNN s'avère efficace pour prédire les données des séries chronologiques épidémiques avec une grande précision, démontrant ainsi son potentiel dans les applications de surveillance des épidémies et d'alerte précoce. Cependant, d'autres discussions et études sont nécessaires pour affiner ses méthodes d'application et de jugement, en soulignant le besoin continu d'exploration et de recherche dans ce domaine.Translated Description (Spanish)
Objetivo Este estudio se centra en mejorar la precisión de la predicción de datos de series temporales epidémicas mediante la integración de la Unidad Recurrente Cerrada (Gru) en una Red Neuronal Gráfica (GNN), formando el GRGNN. La precisión de la red GNN (Graph Neural Network) con las Gru (Gated Recurrent Units) introducidas se valida comparándola con siete métodos de predicción comúnmente utilizados. Método La metodología GRGNN implica la predicción de series temporales multivariantes utilizando una red GNN (Graph Neural Network) mejorada por la integración de Gru (Gated Recurrent Units). Además, se introducen la Transformada Gráfica de Fourier (GFT) y la Transformada Discreta de Fourier (DFT). La GFT captura las correlaciones entre secuencias en el dominio espectral, mientras que la DFT transforma los datos del dominio del tiempo al dominio de la frecuencia, revelando las correlaciones de los nodos temporales. Después de GFT y DFT, los datos del brote se predicen a través de convolución unidimensional y regresión lineal controlada en el dominio de la frecuencia, convolución del gráfico en el dominio espectral y Gru (unidades recurrentes controladas) en el dominio del tiempo. Se emplea la transformación inversa de GFT y DFT, y las predicciones finales se obtienen después de pasar por una capa completamente conectada. La evaluación se lleva a cabo en tres conjuntos de datos: los conjuntos de datos de COVID-19 de 38 países africanos y 42 países europeos de worldometers, y el conjunto de datos de varicela de 20 regiones húngaras de Kaggle. Las métricas incluyen el error cuadrático medio medio (ARMSE) y el error absoluto medio medio (AMAE). Resultado Para el conjunto de datos de COVID-19 africano y el conjunto de datos de varicela húngaro, GRGNN supera constantemente a otros métodos en ARMSE y AMAE en varias longitudes de pasos de predicción. Los resultados óptimos se logran incluso en pasos de predicción extendidos, lo que destaca la solidez del modelo. Conclusión GRGNN demuestra ser eficaz en la predicción de datos de series temporales epidémicas con alta precisión, lo que demuestra su potencial en aplicaciones de vigilancia epidémica y alerta temprana. Sin embargo, se justifican más discusiones y estudios para refinar sus métodos de aplicación y juicio, enfatizando la necesidad continua de exploración e investigación en este dominio.Files
pdf.pdf
Files
(951.5 kB)
Name | Size | Download all |
---|---|---|
md5:f92742906c4fd9388d3f164857019318
|
951.5 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- دمج الوحدة المتكررة المسورة في الشبكة العصبية للرسم البياني لتحسين التنبؤ بالأمراض المعدية: محاولة
- Translated title (French)
- Intégration d'une unité récurrente fermée dans un réseau neuronal graphique pour améliorer la prédiction des maladies infectieuses : une tentative
- Translated title (Spanish)
- Integración de la unidad recurrente cerrada en la red neuronal gráfica para mejorar la predicción de enfermedades infecciosas: un intento
Identifiers
- Other
- https://openalex.org/W4398137788
- DOI
- 10.3389/fpubh.2024.1397260
References
- https://openalex.org/W20141250
- https://openalex.org/W2097446414
- https://openalex.org/W2117014758
- https://openalex.org/W2255466643
- https://openalex.org/W2579495707
- https://openalex.org/W2613331518
- https://openalex.org/W2618530766
- https://openalex.org/W2755132572
- https://openalex.org/W2792764867
- https://openalex.org/W2807252330
- https://openalex.org/W2807894308
- https://openalex.org/W2947116889
- https://openalex.org/W2950635152
- https://openalex.org/W2952042565
- https://openalex.org/W2963358464
- https://openalex.org/W2964319113
- https://openalex.org/W2965092899
- https://openalex.org/W2969855422
- https://openalex.org/W3011945457
- https://openalex.org/W3080376427
- https://openalex.org/W3105931142
- https://openalex.org/W3139204882
- https://openalex.org/W3159901390
- https://openalex.org/W3216532825
- https://openalex.org/W4200120138
- https://openalex.org/W4207002203
- https://openalex.org/W4224229607
- https://openalex.org/W4295950983
- https://openalex.org/W4309941137
- https://openalex.org/W4313904605
- https://openalex.org/W4317495874
- https://openalex.org/W4362624772
- https://openalex.org/W4392672418