AlexU-AL at SemEval-2022 Task 6: Detecting Sarcasm in Arabic Text Using Deep Learning Techniques
Description
Sarcasm detection is an important task in Natural Language Understanding.Sarcasm is a form of verbal irony that occurs when there is a discrepancy between the literal and intended meanings of an expression.In this paper, we use the tweets of the Arabic dataset provided by SemEval-2022 task 6 to train deep learning classifiers to solve the sub-tasks A and C associated with the dataset.Sub-task A is to determine if the tweet is sarcastic or not.For sub-task C, given a sarcastic text and its non-sarcastic rephrase, i.e. two texts that convey the same meaning, determine which is the sarcastic one.In our solution, we utilize finetuned MARBERT (Abdul-Mageed et al., 2021) model with an added single linear layer on top for classification.The proposed solution achieved 0.5076 F1-sarcastic in Arabic sub-task A, accuracy of 0.7450 and F-score of 0.7442 in Arabic sub-task C. We achieved the 2 nd and the 9 th places for Arabic sub-tasks A and C respectively.
Translated Descriptions
Translated Description (Arabic)
يعد الكشف عن السخرية مهمة مهمة في فهم اللغة الطبيعية. السخرية هي شكل من أشكال السخرية اللفظية التي تحدث عندما يكون هناك تناقض بين المعنى الحرفي والمقصود للتعبير. في هذه الورقة، نستخدم تغريدات مجموعة البيانات العربية المقدمة من SemEval -2022 المهمة 6 لتدريب مصنفات التعلم العميق على حل المهام الفرعية A و C المرتبطة بمجموعة البيانات. المهمة الفرعية A هي تحديد ما إذا كانت التغريدة ساخرة أم لا. بالنسبة للمهمة الفرعية C، بالنظر إلى نص ساخر وإعادة صياغته غير الساخرة، أي نصين يحملان نفس المعنى، وتحديد المعنى الساخر. في حلنا، نستخدم نموذج MARBERT المضبوط بدقة (Abdul - Mageed et al.، 2021) مع طبقة خطية واحدة مضافة في الأعلى للتصنيف. حقق الحل المقترح 0.5076 Farcastic في المهمة الفرعية العربية A، بدقة 0.7450 و F - score of 0.7442 في المهمة الفرعية العربية C. حققنا 2 و 9 أماكن للمهام الفرعية العربية و C على التوالي.Translated Description (French)
La détection du sarcasme est une tâche importante dans la compréhension du langage naturel. Le sarcasme est une forme d'ironie verbale qui se produit lorsqu'il y a une divergence entre les significations littérale et intentionnelle d'une expression. Dans cet article, nous utilisons les tweets de l'ensemble de données arabes fournis par la tâche 6 de SemEval-2022 pour former des classificateurs d'apprentissage profond pour résoudre les sous-tâches A et C associées à l'ensemble de données. La sous-tâche A consiste à déterminer si le tweet est sarcastique ou non. Pour la sous-tâche C, étant donné un texte sarcastique et sa reformulation non sarcastique, c'est-à-dire deux textes qui transmettent la même signification, déterminez laquelle est sarcastique. Dans notre solution, nous utilisons le modèle MARBERT affiné (Abdul-Mageed et al., 2021) avec une couche linéaire unique ajoutée au-dessus pour la classification. La solution proposée a atteint 0,5076 F1-sarcastique en sous-tâche arabe A, précision de 0,7450 et F-score de 0,7442 en sous-tâche arabe C. Nous avons atteint les 2 ème et 9 ème places pour les sous-tâches arabes A et C respectivement.Translated Description (Spanish)
La detección del sarcasmo es una tarea importante en la comprensión del lenguaje natural. El sarcasmo es una forma de ironía verbal que se produce cuando hay una discrepancia entre los significados literales y previstos de una expresión. En este documento, utilizamos los tweets del conjunto de datos en árabe proporcionado por la tarea 6 de SemEval-2022 para entrenar a los clasificadores de aprendizaje profundo para resolver las subtareas A y C asociadas con el conjunto de datos. La subtarea A es determinar si el tweet es sarcástico o no. Para la subtarea C, dado un texto sarcástico y su reformulación no sarcástica, es decir, dos textos que transmiten el mismo significado, determinan cuál es el sarcástico. En nuestra solución, utilizamos el modelo MARBERT finetuned (Abdul-Mageed et al., 2021) con una capa lineal única añadida en la parte superior para la clasificación. La solución propuesta logró 0.5076 F1-sarcastic en la subtarea A en árabe, precisión de 0.7450 y F-score de 0.7442 en la subtarea C en árabe. Logramos el 2 .º y el 9 .º lugar para las subtareas A y C en árabe, respectivamente.Files
2022.semeval-1.125.pdf.pdf
Files
(167.5 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:bf2ad5bebb9b8bbe7d2e3d3db924c2b6
|
167.5 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- AlexU - AL في SemEval -2022 المهمة 6: الكشف عن السخرية في النص العربي باستخدام تقنيات التعلم العميق
- Translated title (French)
- AlexU-AL à SemEval-2022 Tâche 6 : Détecter le sarcasme dans le texte arabe à l'aide de techniques d'apprentissage approfondi
- Translated title (Spanish)
- AlexU-AL en SemEval-2022 Tarea 6: Detección de sarcasmo en texto árabe utilizando técnicas de aprendizaje profundo
Identifiers
- Other
- https://openalex.org/W4287854812
- DOI
- 10.18653/v1/2022.semeval-1.125
References
- https://openalex.org/W2019759670
- https://openalex.org/W2059464680
- https://openalex.org/W2250243742
- https://openalex.org/W2250539671
- https://openalex.org/W2513973860
- https://openalex.org/W2807333695
- https://openalex.org/W2963341956
- https://openalex.org/W3032561420
- https://openalex.org/W3176169354