Finding an Accurate Early Forecasting Model from Small Dataset: A Case of 2019-nCoV Novel Coronavirus Outbreak
Creators
- 1. University of Macau
- 2. Zhuhai Institute of Advanced Technology
- 3. Chinese Academy of Sciences
- 4. Techno India University
- 5. Universidad Internacional De La Rioja
- 6. Universidad de Granada
Description
Epidemic is a rapid and wide spread of infectious disease threatening many lives and economy damages. It is important to fore-tell the epidemic lifetime so to decide on timely and remedic actions. These measures include closing borders, schools, suspending community services and commuters. Resuming such curfews depends on the momentum of the outbreak and its rate of decay. Being able to accurately forecast the fate of an epidemic is an extremely important but difficult task. Due to limited knowledge of the novel disease, the high uncertainty involved and the complex societal-political factors that influence the widespread of the new virus, any forecast is anything but reliable. Another factor is the insufficient amount of available data. Data samples are often scarce when an epidemic just started. With only few training samples on hand, finding a forecasting model which offers forecast at the best efforts is a big challenge in machine learning. In the past, three popular methods have been proposed, they include 1) augmenting the existing little data, 2) using a panel selection to pick the best forecasting model from several models, and 3) fine-tuning the parameters of an individual forecastingmodel for the highest possible accuracy. In this paper, a methodology that embraces these three virtues of data mining from a small dataset is proposed...
Translated Descriptions
Translated Description (Arabic)
الوباء هو انتشار سريع وواسع النطاق للأمراض المعدية التي تهدد العديد من الأرواح والأضرار الاقتصادية. من المهم التنبؤ بعمر الوباء حتى يتم اتخاذ قرار بشأن الإجراءات العلاجية في الوقت المناسب. وتشمل هذه التدابير إغلاق الحدود والمدارس وتعليق الخدمات المجتمعية والركاب. ويعتمد استئناف حظر التجول هذا على زخم التفشي ومعدل اضمحلاله. تعد القدرة على التنبؤ بدقة بمصير الوباء مهمة بالغة الأهمية ولكنها صعبة. نظرًا للمعرفة المحدودة بالمرض الجديد، وعدم اليقين الشديد الذي ينطوي عليه والعوامل الاجتماعية والسياسية المعقدة التي تؤثر على انتشار الفيروس الجديد، فإن أي تنبؤ لا يمكن الاعتماد عليه على الإطلاق. عامل آخر هو عدم كفاية كمية البيانات المتاحة. غالبًا ما تكون عينات البيانات نادرة عندما يبدأ الوباء للتو. مع وجود عدد قليل فقط من عينات التدريب في متناول اليد، فإن العثور على نموذج التنبؤ الذي يقدم توقعات بأفضل الجهود يمثل تحديًا كبيرًا في التعلم الآلي. في الماضي، تم اقتراح ثلاث طرق شائعة، تشمل 1) زيادة البيانات الصغيرة الحالية، 2) استخدام اختيار لوحة لاختيار أفضل نموذج للتنبؤ من عدة نماذج، و 3) ضبط معايير نموذج التنبؤ الفردي لأعلى دقة ممكنة. في هذه الورقة، يتم اقتراح منهجية تتبنى هذه الفضائل الثلاث لاستخراج البيانات من مجموعة بيانات صغيرة...Translated Description (French)
L'épidémie est une propagation rapide et étendue de maladies infectieuses menaçant de nombreuses vies et des dommages économiques. Il est important de prédire la durée de vie de l'épidémie afin de décider des actions opportunes et correctives. Ces mesures comprennent la fermeture des frontières, des écoles, la suspension des services communautaires et des navetteurs. La reprise de ces couvre-feux dépend de l'élan de l'épidémie et de son taux de dégradation. Être capable de prévoir avec précision le sort d'une épidémie est une tâche extrêmement importante mais difficile. En raison de la connaissance limitée de la nouvelle maladie, de la grande incertitude et des facteurs sociétaux et politiques complexes qui influencent la propagation du nouveau virus, toute prévision est tout sauf fiable. Un autre facteur est la quantité insuffisante de données disponibles. Les échantillons de données sont souvent rares lorsqu'une épidémie vient de commencer. Avec seulement quelques échantillons de formation disponibles, trouver un modèle de prévision qui offre des prévisions au mieux est un grand défi en apprentissage automatique. Dans le passé, trois méthodes populaires ont été proposées, elles comprennent 1) l'augmentation des petites données existantes, 2) l'utilisation d'une sélection de panneaux pour choisir le meilleur modèle de prévision parmi plusieurs modèles, et 3) le réglage fin des paramètres d'un modèle de prévision individuel pour la plus grande précision possible. Dans cet article, une méthodologie qui embrasse ces trois vertus de l'exploration de données à partir d'un petit ensemble de données est proposée...Translated Description (Spanish)
La epidemia es una propagación rápida y amplia de enfermedades infecciosas que amenaza muchas vidas y daños económicos. Es importante contar de antemano la duración de la epidemia para decidir sobre las acciones oportunas y correctivas. Estas medidas incluyen el cierre de las fronteras, las escuelas, la suspensión de los servicios comunitarios y los desplazamientos. La reanudación de estos toques de queda depende del impulso del brote y de su tasa de decaimiento. Ser capaz de pronosticar con precisión el destino de una epidemia es una tarea extremadamente importante pero difícil. Debido al limitado conocimiento de la nueva enfermedad, la alta incertidumbre involucrada y los complejos factores sociopolíticos que influyen en la propagación del nuevo virus, cualquier pronóstico es cualquier cosa menos confiable. Otro factor es la cantidad insuficiente de datos disponibles. Las muestras de datos a menudo son escasas cuando acaba de comenzar una epidemia. Con solo unas pocas muestras de capacitación disponibles, encontrar un modelo de pronóstico que ofrezca el mejor pronóstico es un gran desafío en el aprendizaje automático. En el pasado, se han propuesto tres métodos populares, que incluyen 1) aumentar los pocos datos existentes, 2) usar una selección de panel para elegir el mejor modelo de pronóstico de varios modelos y 3) ajustar los parámetros de un modelo de pronóstico individual para obtener la mayor precisión posible. En este trabajo, se propone una metodología que abarca estas tres virtudes de la minería de datos a partir de un pequeño conjunto de datos...Files
ijimai20206_1_15_pdf_18033.pdf.pdf
Files
(1.0 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:68dd04669ea7aa09ddd9b6f6bd2ef17a
|
1.0 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- العثور على نموذج دقيق للتنبؤ المبكر من مجموعة بيانات صغيرة: حالة تفشي فيروس كورونا المستجد 2019 - nCoV
- Translated title (French)
- Trouver un modèle de prévision précoce précis à partir d'un petit ensemble de données : un cas d'épidémie de coronavirus 2019-nCoV
- Translated title (Spanish)
- Encontrar un modelo de pronóstico temprano preciso a partir de un pequeño conjunto de datos: un caso del nuevo brote de coronavirus 2019-nCoV
Identifiers
- Other
- https://openalex.org/W3106321705
- DOI
- 10.9781/ijimai.2020.02.002
References
- https://openalex.org/W14214433
- https://openalex.org/W1572978214
- https://openalex.org/W1573560801
- https://openalex.org/W1835690719
- https://openalex.org/W1964552793
- https://openalex.org/W2007466077
- https://openalex.org/W2055823751
- https://openalex.org/W2090398894
- https://openalex.org/W2113517874
- https://openalex.org/W2122284941
- https://openalex.org/W2141589598
- https://openalex.org/W2288450706
- https://openalex.org/W2568988948
- https://openalex.org/W2760535917
- https://openalex.org/W2801285981
- https://openalex.org/W2888392803
- https://openalex.org/W2895708025
- https://openalex.org/W2946942723
- https://openalex.org/W3004003372
- https://openalex.org/W4242046871
- https://openalex.org/W4387170654