Published August 18, 2022 | Version v1
Publication

Large Dataset of Nigeria Covid-19 Tweets for Sentiment Analysis and Opinion Mining Tasks

  • 1. Federal University of Agriculture
  • 2. Østfold University College
  • 3. Kaunas University of Technology

Description

Background Information is essential for growth; without it, little can be accomplished. Data gathering has seen significant changes throughout the previous few centuries because of certain transitory medium. The look and style of information transference are affected by the employment of new and emerging technologies, some of which are efficient, others are reliable, and many more are quick and effective, but a few were disappointing for various reasons. Aims This study aims at using TextBlob and VADER analyser with historical tweets, to analyse emotional responses to the corona virus pandemic (covid-19). It shows us how much of a sociological, environmental, and economic impact it has in Nigeria, among other things. This study would be a tremendous step forward for students, researchers, and scholars who want to advance in fields like data science, machine learning, and deep learning. Methodology The hashtag 'covid-19' was used to collect 1,048,575 tweets from Twitter. The tweets were pre-processed with a twitter tokenizer, and Valence Aware Dictionary for Sentiment Reasoning (VADER) and TextBlob were used for sentiment and text mining, respectively. Topic modelling was done with Latent Dirichlet Allocation (LDA). The simulated subjects, on the other hand, were visualized using Multidimensional scaling (MDS). Results The result of the VADER sentiment returned 39.8%, 31.3% and 28.9%, positive, neutral, and negative sentiment respectively while the result of the TextBlob sentiment returned 46.0%, 36.7% and 17.3%, neutral, positive, and negative sentiment, respectively. Conclusion With all of this, information from social media may be used to help organizations, governments, and nations around the world make smart and effective decisions about how to restrict and limit the negative effects of covid-19. Also know the opinion and challenges of people, then deal with problem of misinformation. It is concluded that with popular belief a significant number of the populace regards covid-19 as a virus that has come to stay, some believe it will eventually be conquered.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

المعلومات الأساسية ضرورية للنمو ؛ وبدونها، لا يمكن تحقيق سوى القليل. شهد جمع البيانات تغييرات كبيرة على مدار القرون القليلة الماضية بسبب وسيط عابر معين. يتأثر شكل وأسلوب نقل المعلومات بتوظيف التقنيات الجديدة والناشئة، وبعضها فعال، والبعض الآخر موثوق به، والعديد منها سريع وفعال، لكن القليل منها كان مخيباً للآمال لأسباب مختلفة. تهدف هذه الدراسة إلى استخدام محلل TextBlob و VADER مع التغريدات التاريخية، لتحليل الاستجابات العاطفية لوباء فيروس كورونا (كوفيد-19). إنه يوضح لنا مدى تأثيره الاجتماعي والبيئي والاقتصادي في نيجيريا، من بين أمور أخرى. ستكون هذه الدراسة خطوة هائلة إلى الأمام للطلاب والباحثين والباحثين الذين يرغبون في التقدم في مجالات مثل علوم البيانات والتعلم الآلي والتعلم العميق. المنهجية تم استخدام الوسم "كوفيد-19" لجمع 1,048,575 تغريدة من تويتر. تمت معالجة التغريدات مسبقًا باستخدام رمز مميز على تويتر، وتم استخدام قاموس Valence Aware لاستدلال المشاعر (VADER) و TextBlob لتعدين المشاعر والنصوص، على التوالي. تم إجراء نمذجة الموضوع باستخدام تخصيص ديريتشليت الكامن (LDA). من ناحية أخرى، تم تصور الموضوعات المحاكاة باستخدام التحجيم متعدد الأبعاد (MDS). النتائج عادت نتيجة معنويات VADER بنسبة 39.8 ٪ و 31.3 ٪ و 28.9 ٪، إيجابية ومحايدة وسلبية على التوالي، في حين عادت نتيجة معنويات TextBlob بنسبة 46.0 ٪ و 36.7 ٪ و 17.3 ٪، محايدة وإيجابية وسلبية، على التوالي. الخلاصة مع كل هذا، يمكن استخدام المعلومات من وسائل التواصل الاجتماعي لمساعدة المنظمات والحكومات والدول في جميع أنحاء العالم على اتخاذ قرارات ذكية وفعالة حول كيفية تقييد الآثار السلبية لـكوفيد-19 والحد منها. تعرف أيضًا على رأي الأشخاص وتحدياتهم، ثم تعامل مع مشكلة المعلومات المضللة. يُستنتج أنه مع الاعتقاد الشائع بأن عددًا كبيرًا من السكان يعتبرون كوفيد-19 فيروسًا جاء ليبقى، يعتقد البعض أنه سيتم قهره في نهاية المطاف.

Translated Description (French)

Les informations de base sont essentielles à la croissance ; sans elles, peu de choses peuvent être accomplies. La collecte de données a connu des changements importants au cours des derniers siècles en raison de certains milieux transitoires. L'apparence et le style du transfert d'informations sont affectés par l'utilisation de technologies nouvelles et émergentes, dont certaines sont efficaces, d'autres fiables et beaucoup d'autres rapides et efficaces, mais quelques-unes ont été décevantes pour diverses raisons. Objectifs Cette étude vise à utiliser TextBlob et l'analyseur VADER avec des tweets historiques, pour analyser les réponses émotionnelles à la pandémie de coronavirus (covid-19). Il nous montre à quel point il a un impact sociologique, environnemental et économique au Nigeria, entre autres choses. Cette étude constituerait un énorme pas en avant pour les étudiants, les chercheurs et les universitaires qui souhaitent progresser dans des domaines tels que la science des données, l'apprentissage automatique et l'apprentissage profond. Méthodologie Le hashtag « covid-19 » a été utilisé pour collecter 1 048 575 tweets sur Twitter. Les tweets ont été prétraités avec un tokenizer Twitter, et Valence Aware Dictionary for Sentiment Reasoning (VADER) et TextBlob ont été utilisés pour le sentiment et l'exploration de texte, respectivement. La modélisation du sujet a été réalisée avec Latent Dirichlet Allocation (LDA). Les sujets simulés, d'autre part, ont été visualisés à l'aide de la mise à l'échelle multidimensionnelle (Mds). Résultats Le résultat du sentiment de VADER a donné respectivement 39,8 %, 31,3 % et 28,9 % de sentiment positif, neutre et négatif, tandis que le résultat du sentiment de TextBlob a donné respectivement 46,0 %, 36,7 % et 17,3 % de sentiment neutre, positif et négatif. Conclusion Avec tout cela, les informations provenant des médias sociaux peuvent être utilisées pour aider les organisations, les gouvernements et les nations du monde entier à prendre des décisions intelligentes et efficaces sur la façon de restreindre et de limiter les effets négatifs de la COVID-19. Connaître également l'opinion et les défis des gens, puis traiter le problème de la désinformation. Il est conclu qu'avec la croyance populaire, un nombre important de la population considère le covid-19 comme un virus qui est venu à rester, certains croient qu'il sera finalement vaincu.

Translated Description (Spanish)

La información de antecedentes es esencial para el crecimiento; sin ella, poco se puede lograr. La recopilación de datos ha experimentado cambios significativos a lo largo de los siglos anteriores debido a cierto medio transitorio. El aspecto y el estilo de la transferencia de información se ven afectados por el empleo de tecnologías nuevas y emergentes, algunas de las cuales son eficientes, otras son confiables y muchas más son rápidas y efectivas, pero algunas fueron decepcionantes por varias razones. Objetivos Este estudio tiene como objetivo utilizar el analizador TextBlob y VADER con tweets históricos, para analizar las respuestas emocionales a la pandemia del coronavirus (covid-19). Nos muestra cuánto impacto sociológico, ambiental y económico tiene en Nigeria, entre otras cosas. Este estudio sería un gran paso adelante para los estudiantes, investigadores y académicos que desean avanzar en campos como la ciencia de datos, el aprendizaje automático y el aprendizaje profundo. Metodología Se utilizó el hashtag 'covid-19' para recopilar 1.048.575 tweets de Twitter. Los tweets se preprocesaron con un tokenizador de twitter, y Valence Aware Dictionary for Sentiment Reasoning (VADER) y TextBlob se utilizaron para la extracción de sentimientos y textos, respectivamente. El modelado de temas se realizó con asignación latente de Dirichlet (LDA). Los sujetos simulados, por otro lado, se visualizaron utilizando escalado multidimensional (MDS). Resultados El resultado del sentimiento VADER arrojó un 39,8%, un 31,3% y un 28,9% de sentimiento positivo, neutro y negativo, respectivamente, mientras que el resultado del sentimiento TextBlob arrojó un 46,0%, un 36,7% y un 17,3% de sentimiento neutro, positivo y negativo, respectivamente. Conclusión Con todo esto, la información de las redes sociales puede usarse para ayudar a organizaciones, gobiernos y naciones de todo el mundo a tomar decisiones inteligentes y efectivas sobre cómo restringir y limitar los efectos negativos del covid-19. También conocer la opinión y los desafíos de las personas, luego lidiar con el problema de la desinformación. Se concluye que con la creencia popular un número significativo de la población considera el covid-19 como un virus que ha llegado para quedarse, algunos creen que eventualmente será conquistado.

Additional details

Additional titles

Translated title (Arabic)
مجموعة بيانات كبيرة من تغريدات نيجيريا حول كوفيد-19 لتحليل المشاعر ومهام تعدين الآراء
Translated title (French)
Grand ensemble de données sur les tweets du Nigeria sur la Covid-19 pour l'analyse des sentiments et les tâches d'extraction d'opinions
Translated title (Spanish)
Gran conjunto de datos de los tweets de Covid-19 de Nigeria para el análisis de sentimientos y las tareas de minería de opiniones

Identifiers

Other
https://openalex.org/W4394034843
DOI
10.5281/zenodo.4748714

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Nigeria