Published January 1, 2015 | Version v1
Publication Open

Arabic Sentiment Analysis: A Survey

  • 1. King Saud University
  • 2. Menoufia University

Description

Most social media commentary in the Arabic language space is made using unstructured non-grammatical slang Arabic language, presenting complex challenges for sentiment analysis and opinion extraction of online commentary and micro blogging data in this important domain.This paper provides a comprehensive analysis of the important research works in the field of Arabic sentiment analysis.An in-depth qualitative analysis of the various features of the research works is carried out and a summary of objective findings is presented.We used smoothness analysis to evaluate the percentage error in the performance scores reported in the studies from their linearly-projected values (smoothness) which is an estimate of the influence of the different approaches used by the authors on the performance scores obtained.To solve a bounding issue with the data as it was reported, we modified existing logarithmic smoothing technique and applied it to pre-process the performance scores before the analysis.Our results from the analysis have been reported and interpreted for the various performance parameters: accuracy, precision, recall and F-score.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يتم إجراء معظم التعليقات على وسائل التواصل الاجتماعي في مساحة اللغة العربية باستخدام اللغة العربية العامية غير النحوية غير المهيكلة، مما يمثل تحديات معقدة لتحليل المشاعر واستخراج الآراء من بيانات التعليقات والمدونات الصغيرة عبر الإنترنت في هذا المجال المهم. توفر هذه الورقة تحليلاً شاملاً للأعمال البحثية المهمة في مجال تحليل المشاعر العربية. يتم إجراء تحليل نوعي متعمق للميزات المختلفة لأعمال البحث ويتم تقديم ملخص للنتائج الموضوعية. استخدمنا تحليل السلاسة لتقييم النسبة المئوية للخطأ في درجات الأداء المبلغ عنها في الدراسات من قيمهم المتوقعة خطيًا (السلاسة) وهي تقدير لتأثير الأساليب المختلفة التي يستخدمها المؤلفون على درجات الأداء التي تم الحصول عليها. لحل مشكلة ربط البيانات كما تم الإبلاغ عنها، قمنا بتعديل تقنية التنعيم اللوغاريتمي الحالية وتطبيقها على المعالجة المسبقة لدرجات الأداء قبل التحليل. تم الإبلاغ عن نتائجنا من التحليل وتفسيرها لمعلمات الأداء المختلفة: الدقة والدقة والتذكر والدرجة F.

Translated Description (French)

La plupart des commentaires des médias sociaux dans l'espace de la langue arabe sont faits en utilisant l'argot non programmatique non structuré langue arabe, présentant des défis complexes pour l'analyse des sentiments et l'extraction de l'opinion des commentaires en ligne et des données de micro-blogging dans ce domaine important. Cet article fournit une analyse complète des travaux de recherche importants dans le domaine de l'analyse du sentiment arabe. Une analyse qualitative approfondie des différentes caractéristiques des travaux de recherche est effectuée et un résumé des résultats objectifs est présenté. Nous avons utilisé l'analyse de lissé pour évaluer l'erreur en pourcentage dans les scores de performance rapportés dans les études à partir de leurs valeurs projetées linéairement (lissé) qui est une estimation de l'influence des différentes approches utilisées par les auteurs sur les scores de performance obtenus. Pour résoudre un problème limitatif avec les données telles qu'elles ont été rapportées, nous avons modifié la technique de lissage logarithmique existante et l'avons appliquée au prétraitement des scores de performance avant l'analyse. Nos résultats de l'analyse ont été rapportés et interprétés pour les différents paramètres de performance : précision, précision, rappel et F-score.

Translated Description (Spanish)

La mayoría de los comentarios de las redes sociales en el espacio del idioma árabe se realizan utilizando la jerga no gramatical no estructurada del idioma árabe, presentando desafíos complejos para el análisis de sentimientos y la extracción de opiniones de los comentarios en línea y los datos de microblogs en este importante dominio. Este documento proporciona un análisis exhaustivo de los importantes trabajos de investigación en el campo del análisis de sentimientos en árabe. Se lleva a cabo un análisis cualitativo en profundidad de las diversas características de los trabajos de investigación y se presenta un resumen de los hallazgos objetivos. Utilizamos el análisis de suavidad para evaluar el porcentaje de error en las puntuaciones de rendimiento informadas en los estudios a partir de sus valores proyectados linealmente (suavidad), que es una estimación de la influencia de los diferentes enfoques utilizados por los autores en las puntuaciones de rendimiento obtenidas. Para resolver un problema de delimitación con los datos tal como se informaron, modificamos la técnica de suavizado logarítmico existente y la aplicamos para preprocesar las puntuaciones de rendimiento antes del análisis. Nuestros resultados del análisis se han informado e interpretado para los diversos parámetros de rendimiento: precisión, precisión, recuerdo y puntaje F.

Files

Paper_11-Arabic_Sentiment_Analysis_A_Survey.pdf.pdf

Files (384.5 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:d547f41a4eb6ca03c8602e398350ec45
384.5 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
تحليل المشاعر العربية: دراسة استقصائية
Translated title (French)
Analyse des sentiments arabes : une enquête
Translated title (Spanish)
Análisis de sentimientos en árabe: una encuesta

Identifiers

Other
https://openalex.org/W2268110014
DOI
10.14569/ijacsa.2015.061211

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Egypt

References

  • https://openalex.org/W15334911
  • https://openalex.org/W154158788
  • https://openalex.org/W1740779835
  • https://openalex.org/W1759852148
  • https://openalex.org/W1839863673
  • https://openalex.org/W1909487923
  • https://openalex.org/W194416169
  • https://openalex.org/W1964168965
  • https://openalex.org/W1970592556
  • https://openalex.org/W1988939740
  • https://openalex.org/W1994972134
  • https://openalex.org/W2003989635
  • https://openalex.org/W2012070465
  • https://openalex.org/W2018626394
  • https://openalex.org/W2021137987
  • https://openalex.org/W2022804876
  • https://openalex.org/W2026456743
  • https://openalex.org/W2027232045
  • https://openalex.org/W2042763715
  • https://openalex.org/W2044758374
  • https://openalex.org/W2044937105
  • https://openalex.org/W2047308542
  • https://openalex.org/W2054197840
  • https://openalex.org/W2057854333
  • https://openalex.org/W2066129432
  • https://openalex.org/W2070824330
  • https://openalex.org/W2081334131
  • https://openalex.org/W2088394786
  • https://openalex.org/W2108646579
  • https://openalex.org/W2109782117
  • https://openalex.org/W2114985053
  • https://openalex.org/W2120400822
  • https://openalex.org/W2123415724
  • https://openalex.org/W2125283600
  • https://openalex.org/W2127613773
  • https://openalex.org/W2131987814
  • https://openalex.org/W2143902425
  • https://openalex.org/W2143934623
  • https://openalex.org/W2150341604
  • https://openalex.org/W2151739810
  • https://openalex.org/W2151810470
  • https://openalex.org/W2156413587
  • https://openalex.org/W2156741031
  • https://openalex.org/W2159080219
  • https://openalex.org/W2162357159
  • https://openalex.org/W2170436435
  • https://openalex.org/W2182577663
  • https://openalex.org/W2222023357
  • https://openalex.org/W2250981850
  • https://openalex.org/W2251009596
  • https://openalex.org/W2252067416
  • https://openalex.org/W2277115990
  • https://openalex.org/W2327164475
  • https://openalex.org/W3172838183