Published January 1, 2021
| Version v1
Publication
Open
Adversities are all you need: Classification of self-reported breast cancer posts on Twitter using Adversarial Fine-tuning
Description
In this paper, we describe our system entry for Shared Task 8 at SMM4H-2021 , which is on automatic classification of self-reported breast cancer posts on Twitter.In our system, we use a transformer-based language model fine-tuning approach to automatically identify tweets in the self-reports category.Furthermore, we involve a Gradient-based Adversarial fine-tuning to improve the overall model's robustness.Our system achieved an F1-score of 0.8625 on the development set and 0.8501 on the test set in Shared Task-8 of SMM4H-2021.
Translated Descriptions
⚠️
This is an automatic machine translation with an accuracy of 90-95%
Translated Description (Arabic)
في هذه الورقة، نصف إدخال نظامنا للمهمة المشتركة 8 في SMM4H -2021، وهو تصنيف تلقائي لمنشورات سرطان الثدي المبلغ عنها ذاتيًا على تويتر. في نظامنا، نستخدم نهج الضبط الدقيق لنموذج اللغة القائم على المحولات لتحديد التغريدات تلقائيًا في فئة التقارير الذاتية. علاوة على ذلك، فإننا نشارك في الضبط الدقيق القائم على التدرج لتحسين متانة النموذج بشكل عام. حقق نظامنا درجة F1 تبلغ 0.8625 في مجموعة التطوير و 0.8501 في مجموعة الاختبار في المهمة المشتركة 8 من SMM4H -2021.Translated Description (French)
Dans cet article, nous décrivons notre entrée système pour la tâche partagée 8 à SMM4H-2021, qui concerne la classification automatique des publications sur le cancer du sein autodéclarées sur Twitter. Dans notre système, nous utilisons une approche de réglage fin du modèle de langage basée sur un transformateur pour identifier automatiquement les tweets dans la catégorie des autodéclarations. En outre, nous impliquons un réglage fin antagoniste basé sur un gradient pour améliorer la robustesse globale du modèle. Notre système a obtenu un score F1 de 0,8625 sur l'ensemble de développement et de 0,8501 sur l'ensemble de test dans la tâche partagée 8 de SMM4H-2021.Translated Description (Spanish)
En este documento, describimos la entrada de nuestro sistema para la Tarea compartida 8 en SMM4H-2021, que trata sobre la clasificación automática de publicaciones de cáncer de mama autoinformadas en Twitter. En nuestro sistema, utilizamos un enfoque de ajuste fino del modelo de lenguaje basado en transformadores para identificar automáticamente los tweets en la categoría de autoinformes. Además, involucramos un ajuste fino adversarial basado en gradientes para mejorar la solidez general del modelo. Nuestro sistema logró una puntuación F1 de 0,8625 en el conjunto de desarrollo y 0,8501 en el conjunto de prueba en la Tarea compartida 8 de SMM4H-2021.Files
2021.smm4h-1.22.pdf.pdf
Files
(211.1 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:6c10b842ce32e4d14c6f1cafcacf1f56
|
211.1 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- المحن هي كل ما تحتاجه: تصنيف منشورات سرطان الثدي المبلغ عنها ذاتيًا على تويتر باستخدام الضبط الدقيق للخصوم
- Translated title (French)
- Les adversités sont tout ce dont vous avez besoin : Classification des publications autodéclarées sur le cancer du sein sur Twitter à l'aide de l'ajustement Adversarial
- Translated title (Spanish)
- Las adversidades son todo lo que necesitas: Clasificación de las publicaciones autoinformadas sobre el cáncer de mama en Twitter utilizando Adversarial Fine-tuning
Identifiers
- Other
- https://openalex.org/W3167997488
- DOI
- 10.18653/v1/2021.smm4h-1.22
References
- https://openalex.org/W3026668846