Published January 15, 2021 | Version v1
Publication Open

A COVID-19 Non-contact Screening System Based on XGBoost and Logistic Regression (Preprint)

  • 1. Chinese Academy of Sciences
  • 2. Institute of Microelectronics
  • 3. Peking University Third Hospital
  • 4. Peking University

Description

BACKGROUND COVID-19 is a new infectious disease with high infectivity. At present, body temperature detection is the main method for primary screening, but this single detection method has poor accuracy and is easy to miss detection. OBJECTIVE The objective of our study was to propose a non-contact, high-precision COVID-19 screening system. METHODS We used impulse-radio ultra-wideband (IR-UWB) radar to detect the respiration, heart rate, body movement, sleep quality, and various other physiological indicators. We collected 140 radar monitoring data from 23 COVID-19 patients in Wuhan Tongji Hospital, and compared them with 144 radar monitoring data of healthy controls. Then XGBoost and logistic regression(XGBoost+LR) algorithm was used to classify the data of patients and healthy people; feature selection was performed by SHAP value; using ten-fold cross-validation, XGBoost+LR algorithm was compared with five other classic classification algorithms, and the classification performance was evaluated by precision, recall, and the area under the ROC curve( AUC ). RESULTS The XGBoost+LR algorithm demonstrate excellent discrimination (precision=99.1 %, recall rate = 94.1 %, AUC=98.7 %), which is superior to several other single machine learning algorithms. In addition, the SHAP value indicate that number of apnea during REM(' REMSATims') and mean heart rate('meanHR') are important features for classification. CONCLUSIONS The COVID-19 non-contact screening system based on XGBoost+LR algorithm can accurately predict COVID-19 patients and can be applied in isolation wards to effectively help medical staff.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

خلفية كوفيد-19 هو مرض معدي جديد ذو عدوى عالية. في الوقت الحاضر، يعد الكشف عن درجة حرارة الجسم هو الطريقة الرئيسية للفحص الأولي، ولكن طريقة الكشف الواحدة هذه تتسم بدقة ضعيفة ويسهل تفويتها. الهدف كان الهدف من دراستنا هو اقتراح نظام فحص COVID -19 غير ملامس وعالي الدقة. الطرق استخدمنا رادار الموجات فوق الصوتية (IR - UWB) للكشف عن التنفس ومعدل ضربات القلب وحركة الجسم ونوعية النوم والعديد من المؤشرات الفسيولوجية الأخرى. جمعنا 140 بيانات مراقبة رادارية من 23 مريضًا بكوفيد-19 في مستشفى ووهان تونغجي، وقارناها مع 144 بيانات مراقبة رادارية لضوابط صحية. ثم تم استخدام خوارزمية XGBoost والانحدار اللوجستي (XGBoost+LR) لتصنيف بيانات المرضى والأشخاص الأصحاء ؛ تم إجراء اختيار الميزات بواسطة قيمة SHAP ؛ باستخدام التحقق المتبادل من عشرة أضعاف، تمت مقارنة خوارزمية XGBoost+LR بخمس خوارزميات تصنيف كلاسيكية أخرى، وتم تقييم أداء التصنيف بالدقة والاستدعاء والمنطقة تحت منحنى ROC ( AUC ). النتائج تُظهر خوارزمية XGBoost+LR تمييزًا ممتازًا (الدقة=99.1 ٪، معدل الاستدعاء = 94.1 ٪، AUC=98.7 ٪)، وهو أعلى من العديد من خوارزميات التعلم الآلي الفردية الأخرى. بالإضافة إلى ذلك، تشير قيمة SHAP إلى أن عدد انقطاع النفس أثناء حركة العين السريعة(" REMSATims ") ومتوسط معدل ضربات القلب (" meanHR ") هي ميزات مهمة للتصنيف. الاستنتاجات يمكن لنظام فحص عدم الاتصال COVID -19 القائم على خوارزمية XGBoost+LR التنبؤ بدقة بمرضى COVID -19 ويمكن تطبيقه في أجنحة العزل لمساعدة الطاقم الطبي بشكل فعال.

Translated Description (French)

CONTEXTE La COVID-19 est une nouvelle maladie infectieuse à forte infectivité. À l'heure actuelle, la détection de la température corporelle est la principale méthode de dépistage primaire, mais cette méthode de détection unique a une faible précision et il est facile de manquer la détection. OBJECTIF L'objectif de notre étude était de proposer un système de dépistage de la COVID-19 sans contact et de haute précision. MÉTHODES Nous avons utilisé un radar à bande ultra-large à radio-impulsion (IR-UWB) pour détecter la respiration, la fréquence cardiaque, les mouvements du corps, la qualité du sommeil et divers autres indicateurs physiologiques. Nous avons collecté 140 données de surveillance radar auprès de 23 patients atteints de COVID-19 à l'hôpital de Wuhan Tongji, et les avons comparées à 144 données de surveillance radar de témoins sains. Ensuite, l'algorithme XGBoost et la régression logistique (XGBoost+LR) ont été utilisés pour classer les données des patients et des personnes en bonne santé ; la sélection des caractéristiques a été effectuée par la valeur SHAP ; en utilisant une validation croisée de dix fois, l'algorithme XGBoost+LR a été comparé à cinq autres algorithmes de classification classiques, et les performances de classification ont été évaluées par la précision, le rappel et l'aire sous la courbe roc ( ASC ). RÉSULTATS L'algorithme XGBoost+LR démontre une excellente discrimination (précision=99,1 %, taux de rappel = 94,1 %, ASC=98,7 %), ce qui est supérieur à plusieurs autres algorithmes d'apprentissage automatique simples. En outre, la valeur SHAP indique que le nombre d'apnées pendant le REM(« REMSATims ») et la fréquence cardiaque moyenne (« MeanHR ») sont des caractéristiques importantes pour la classification. CONCLUSIONS Le système de dépistage sans contact COVID-19 basé sur l'algorithme XGBoost+LR peut prédire avec précision les patients COVID-19 et peut être appliqué dans des salles d'isolement pour aider efficacement le personnel médical.

Translated Description (Spanish)

ANTECEDENTES COVID-19 es una nueva enfermedad infecciosa con alta infectividad. En la actualidad, la detección de la temperatura corporal es el método principal para la detección primaria, pero este único método de detección tiene poca precisión y es fácil pasar por alto la detección. OBJETIVO El objetivo de nuestro estudio fue proponer un sistema de detección de COVID-19 sin contacto y de alta precisión. MÉTODOS Utilizamos un radar de radio impulsiva de banda ultraancha (IR-UWB) para detectar la respiración, la frecuencia cardíaca, el movimiento corporal, la calidad del sueño y varios otros indicadores fisiológicos. Recopilamos 140 datos de monitoreo por radar de 23 pacientes con COVID-19 en el Hospital Wuhan Tongji y los comparamos con 144 datos de monitoreo por radar de controles sanos. Luego se utilizó el algoritmo XGBoost y de regresión logística (XGBoost+LR) para clasificar los datos de pacientes y personas sanas; la selección de características se realizó mediante el valor SHAP; utilizando una validación cruzada de diez veces, el algoritmo XGBoost+LR se comparó con otros cinco algoritmos de clasificación clásicos, y el rendimiento de la clasificación se evaluó mediante precisión, recuperación y el área bajo la curva Roc ( AUC ). RESULTADOS El algoritmo XGBoost+LR demuestra una excelente discriminación (precisión=99,1 %, tasa de recuperación = 94,1 %, AUC=98,7 %), que es superior a varios otros algoritmos de aprendizaje automático individuales. Además, el valor de SHAP indica que el número de apnea durante REM(' REMSATims') y la frecuencia cardíaca media ('meanHR') son características importantes para la clasificación. CONCLUSIONES El sistema de detección sin contacto de COVID-19 basado en el algoritmo XGBoost+LR puede predecir con precisión a los pacientes con COVID-19 y se puede aplicar en salas de aislamiento para ayudar eficazmente al personal médico.

Files

preprint-27151-submitted.pdf.pdf

Files (1.8 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:cf3f8881f69e0d9fc78316fda4393b1f
1.8 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
نظام فحص عدم الاتصال COVID -19 بناءً على XGBoost والانحدار اللوجستي (ما قبل الطباعة)
Translated title (French)
Un système de dépistage sans contact COVID-19 basé sur XGBoost et la régression logistique (préimpression)
Translated title (Spanish)
Un sistema de detección sin contacto de COVID-19 basado en XGBoost y regresión logística (preimpresión)

Identifiers

Other
https://openalex.org/W4206396190
DOI
10.2196/preprints.27151

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China