Published January 1, 2021 | Version v1
Publication Open

LISAC FSDM USMBA at SemEval-2021 Task 5: Tackling Toxic Spans Detection Challenge with Supervised SpanBERT-based Model and Unsupervised LIME-based Model

  • 1. Université Ibn-Tofail

Description

Toxic spans detection is an emerging challenge that aims to find toxic spans within a toxic text.In this paper, we describe our solutions to tackle toxic spans detection.The first solution, which follows a supervised approach, is based on SpanBERT model.This latter is intended to better embed and predict spans of text.The second solution, which adopts an unsupervised approach, combines linear support vector machine with the Local Interpretable Model-Agnostic Explanations (LIME).This last is used to interpret predictions of learningbased models.Our supervised model outperformed the unsupervised model and achieved the f-score of 67,84% (ranked 22/85) in Task 5 at SemEval-2021: Toxic Spans Detection.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يعد اكتشاف الامتدادات السامة تحديًا ناشئًا يهدف إلى العثور على الامتدادات السامة داخل النص السام. في هذه الورقة، نصف حلولنا لمعالجة اكتشاف الامتدادات السامة. يعتمد الحل الأول، الذي يتبع نهجًا خاضعًا للإشراف، على نموذج SpanBERT. يهدف هذا الأخير إلى تضمين امتدادات النص والتنبؤ بها بشكل أفضل. يجمع الحل الثاني، الذي يعتمد نهجًا غير خاضع للإشراف، بين آلة ناقلات الدعم الخطية مع التفسيرات المحلية القابلة للتفسير (LIME). يستخدم هذا الأخير لتفسير تنبؤات النماذج القائمة على التعلم. تفوق نموذجنا الخاضع للإشراف على النموذج غير الخاضع للإشراف وحقق درجة f بنسبة 67,84 ٪ (المرتبة 22/85) في المهمة 5 في SemEval -2021: اكتشاف الامتدادات السامة.

Translated Description (French)

La détection des portées toxiques est un défi émergent qui vise à trouver des portées toxiques dans un texte toxique. Dans cet article, nous décrivons nos solutions pour lutter contre la détection des portées toxiques. La première solution, qui suit une approche supervisée, est basée sur le modèle SpanBERT. Ce dernier est destiné à mieux intégrer et prédire les portées de texte. La deuxième solution, qui adopte une approche non supervisée, combine la machine à vecteur de support linéaire avec les explications locales interprétables modèle-gnostic (LIME). Ce dernier est utilisé pour interpréter les prédictions des modèles basés sur l'apprentissage. Notre modèle supervisé a surperformé le modèle non supervisé et a obtenu le score f de 67,84% (classé 22/85) dans la tâche 5 à SemEval-2021 : Détection des portées toxiques.

Translated Description (Spanish)

La detección de tramos tóxicos es un desafío emergente que tiene como objetivo encontrar tramos tóxicos dentro de un texto tóxico. En este documento, describimos nuestras soluciones para abordar la detección de tramos tóxicos. La primera solución, que sigue un enfoque supervisado, se basa en el modelo SpanBERT. Este último está destinado a integrar y predecir mejor los tramos de texto. La segunda solución, que adopta un enfoque no supervisado, combina la máquina de vectores de soporte lineal con las Explicaciones de diagnóstico del modelo interpretable local (LIME). Esta última se utiliza para interpretar las predicciones de los modelos basados en el aprendizaje. Nuestro modelo supervisado superó al modelo no supervisado y logró el puntaje f del 67,84% (clasificado 22/85) en la Tarea 5 en SemEval-2021: Detección de tramos tóxicos.

Files

2021.semeval-1.116.pdf.pdf

Files (277.3 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:4a29e54e98578da99471dd63309514f1
277.3 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
LISAC FSDM USMBA في SemEval -2021 المهمة 5: معالجة تحدي اكتشاف الامتدادات السامة باستخدام النموذج القائم على الامتداد الخاضع للإشراف والنموذج القائم على الحد الأدنى غير الخاضع للإشراف
Translated title (French)
LISAC FSDM USMBA à SemEval-2021 Tâche 5 : Relever le défi de la détection des portées toxiques avec un modèle basé sur SpanBERT supervisé et un modèle basé sur LIME non supervisé
Translated title (Spanish)
LISAC FSDM USMBA en SemEval-2021 Tarea 5: Abordar el desafío de detección de tramos tóxicos con el modelo basado en SpanBERT supervisado y el modelo basado en LIME no supervisado

Identifiers

Other
https://openalex.org/W3186639960
DOI
10.18653/v1/2021.semeval-1.116

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Morocco

References

  • https://openalex.org/W2282821441
  • https://openalex.org/W2540646130
  • https://openalex.org/W2740168486
  • https://openalex.org/W2760103715
  • https://openalex.org/W2920807444
  • https://openalex.org/W2922580172
  • https://openalex.org/W2954643340
  • https://openalex.org/W2962855291
  • https://openalex.org/W2963341956
  • https://openalex.org/W2970487286
  • https://openalex.org/W3011411500