MUCIC@LT-EDI-ACL2022: Hope Speech Detection using Data Re-Sampling and 1D Conv-LSTM
- 1. Mangalore University
- 2. Instituto Politécnico Nacional
Description
Spreading positive vibes or hope content on social media may help many people to get motivated in their life.To address Hope Speech detection in YouTube comments, this paper presents the description of the models submitted by our team -MUCIC, to the Hope Speech Detection for Equality, Diversity, and Inclusion (HopeEDI) shared task at Association for Computational Linguistics (ACL) 2022.This shared task consists of texts in five languages, namely: English, Spanish (in Latin scripts), and Tamil, Malayalam, and Kannada (in code-mixed native and Roman scripts) with the aim of classifying the YouTube comment into "Hope", "Not-Hope" or "Not-Intended" categories.The proposed methodology uses the re-sampling technique to deal with imbalanced data in the corpus and obtained 1 st rank for English language with a macro-averaged F1-score of 0.550 and weighted-averaged F1-score of 0.860.The code to reproduce this work is available in GitHub 1 .
Translated Descriptions
Translated Description (Arabic)
قد يساعد نشر المشاعر الإيجابية أو محتوى الأمل على وسائل التواصل الاجتماعي العديد من الأشخاص على التحفيز في حياتهم. ولمعالجة اكتشاف خطاب الأمل في تعليقات YouTube، تقدم هذه الورقة وصفًا للنماذج المقدمة من فريقنا - MUCIC، إلى مهمة Hope Speech Detection for Equality, Diversity, and Inclusion (HopeEDI) المشتركة في Association for Computational Linguistics (ACL) 2022. تتكون هذه المهمة المشتركة من نصوص بخمس لغات، وهي: الإنجليزية والإسبانية (بالأحرف اللاتينية) والتاميلية والمالايالامية والكانادا (بأحرف أصلية ورومانية مختلطة) بهدف تصنيف تعليق YouTube إلى فئات "Hope" أو "Not - Hope" أو "Not - Intended". تستخدم المنهجية المقترحة تقنية إعادة أخذ العينات للتعامل مع البيانات غير المتوازنة في المجموعة وحصلت على مرتبة واحدة للغة الإنجليزية بمتوسط F1 الكلي 0.550 ومتوسط F1 المرجح 0.860. الرمز لإعادة إنتاج هذا العمل متاح في GitHub 1 .Translated Description (French)
Diffuser des ondes positives ou du contenu d'espoir sur les médias sociaux peut aider de nombreuses personnes à se motiver dans leur vie. Pour aborder la détection du discours d'espoir dans les commentaires YouTube, cet article présente la description des modèles soumis par notre équipe -MUCIC, à la tâche partagée Hope Speech Detection for Equality, Diversity, and Inclusion (HopeEDI) à l'Association for Computational Linguistics (ACL) 2022. Cette tâche partagée se compose de textes en cinq langues, à savoir : l'anglais, l'espagnol (en alphabets latins) et le tamoul, le malayalam et le kannada (en alphabets natifs et romains mélangés en code) dans le but de classer le commentaire YouTube en catégories « Espoir », « Pas d'espoir » ou « Non attendu ». La méthodologie proposée utilise la technique de rééchantillonnage pour traiter les données déséquilibrées dans le corpus et a obtenu un rang 1 pour la langue anglaise avec un score F1 moyen macro de 0,550 et un score F1 moyen pondéré de 0,860. Le code pour reproduire ce travail est disponible dans GitHub 1 .Translated Description (Spanish)
Difundir vibraciones positivas o contenido de esperanza en las redes sociales puede ayudar a muchas personas a motivarse en su vida. Para abordar la detección de Hope Speech en los comentarios de YouTube, este documento presenta la descripción de los modelos presentados por nuestro equipo -MUCIC, a la tarea compartida Hope Speech Detection for Equality, Diversity, and Inclusion (HopeEDI) en la Association for Computational Linguistics (ACL) 2022. Esta tarea compartida consiste en textos en cinco idiomas, a saber: inglés, español (en alfabetos latinos) y tamil, malayalam y kannada (en alfabetos nativos y romanos mezclados en código) con el objetivo de clasificar el comentario de YouTube en categorías "Hope", "Not-Hope" o "Not-Intended". La metodología propuesta utiliza la técnica de re-muestreo para tratar con datos desequilibrados en el corpus y obtuvo el primer rango para el idioma inglés con una puntuación F1 macropromediada de 0.550 y una puntuación F1 promedio ponderada de 0.860. El código para reproducir este trabajo está disponible en GitHub 1 .Files
2022.ltedi-1.20.pdf.pdf
Files
(186.5 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:27aa23b85f53f535617c8d3d860e9b34
|
186.5 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- MUCIC@ LT - EDI - ACL2022: الكشف عن الكلام الأمل باستخدام إعادة أخذ عينات البيانات و 1 D Conv - LSTM
- Translated title (French)
- MUCIC@ LT-EDI-ACL2022 : Détection de la parole Hope à l'aide du rééchantillonnage des données et 1D Conv-LSTM
- Translated title (Spanish)
- MUCIC@LT-EDI-ACL2022: Detección de voz Hope utilizando remuestreo de datos y 1D Conv-LSTM
Identifiers
- Other
- https://openalex.org/W4285167992
- DOI
- 10.18653/v1/2022.ltedi-1.20