Published January 1, 2014 | Version v1
Publication Open

UMCC_DLSI: Sentiment Analysis in Twitter using Polirity Lexicons and Tweet Similarity

Description

This paper describes a system submitted to SemEval-2014 Task 4B: Sentiment Analysis in Twitter, by the team UMCC DLSI Sem integrated by researchers of the University of Matanzas, Cuba and the University of Alicante, Spain.The system adopts a cascade classification process that uses two classifiers, K-NN using the lexical Levenshtein metric and a Dagging model trained over attributes extracted from annotated corpora and sentiment lexicons.Phrases that fit the distance thresholds were automatically classified by the KNN model, the others, were evaluated with the Dagging model.This system achieved over 52.4% of correctly classified instances in the Twitter message-level subtask.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تصف هذه الورقة نظامًا تم تقديمه إلى SemEval -2014 Task 4B: تحليل المشاعر في Twitter، من قبل فريق UMCC DLSI Sem المدمج من قبل باحثين من جامعة Matanzas، كوبا وجامعة Alicante، إسبانيا. يعتمد النظام عملية تصنيف متتالية تستخدم مصنفين، K - NN باستخدام مقياس Levenshtein المعجمي ونموذج Dagging المدرب على السمات المستخرجة من الشركات المشروحة ومعاجم المشاعر. تم تصنيف العبارات التي تناسب عتبات المسافة تلقائيًا بواسطة نموذج KNN، والآخرون، تم تقييمهم باستخدام نموذج Dagging. حقق هذا النظام أكثر من 52.4 ٪ من الحالات المصنفة بشكل صحيح في المهمة الفرعية على مستوى رسالة Twitter.

Translated Description (French)

Ce document décrit un système soumis à SemEval-2014 Task 4B : Sentiment Analysis in Twitter, par l'équipe UMCC DLSI Sem intégrée par des chercheurs de l'Université de Matanzas, Cuba et de l'Université d'Alicante, Espagne. Le système adopte un processus de classification en cascade qui utilise deux classificateurs, K-NN utilisant la métrique lexicale de Levenshtein et un modèle Dagging formé sur des attributs extraits de lexiques de corpora et de sentiment annotés. Les phrases qui correspondent aux seuils de distance ont été automatiquement classées par le modèle KNN, les autres, ont été évaluées avec le modèle Dagging. Ce système a atteint plus de 52,4% des instances correctement classées dans la sous-tâche au niveau des messages Twitter.

Translated Description (Spanish)

Este trabajo describe un sistema presentado a SemEval-2014 Tarea 4B: Análisis de sentimiento en Twitter, por el equipo UMCC DLSI Sem integrado por investigadores de la Universidad de Matanzas, Cuba y la Universidad de Alicante, España. El sistema adopta un proceso de clasificación en cascada que utiliza dos clasificadores, K-NN utilizando la métrica léxica de Levenshtein y un modelo de Dagging entrenado sobre atributos extraídos de corpus anotados y léxicos de sentimiento. Las frases que se ajustan a los umbrales de distancia se clasificaron automáticamente por el modelo KNN, las otras, se evaluaron con el modelo de Dagging. Este sistema logró más del 52,4% de las instancias clasificadas correctamente en la subtarea a nivel de mensaje de Twitter.

Files

S14-2130.pdf.pdf

Files (114.4 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:a192c6256be940a7638beeed48edb8b9
114.4 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
UMCC_DLSI: تحليل المشاعر في تويتر باستخدام معاجم الاستقطاب وتشابه التغريدات
Translated title (French)
UMCC_DLSI : Analyse des sentiments sur Twitter à l'aide des lexiques Polirity et de la similarité des tweets
Translated title (Spanish)
UMCC_DLSI: Análisis de sentimientos en Twitter utilizando Polirity Lexicons y similitud de tweets

Identifiers

Other
https://openalex.org/W2252150188
DOI
10.3115/v1/s14-2130

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Cuba

References

  • https://openalex.org/W1489489715
  • https://openalex.org/W1647671624
  • https://openalex.org/W2166706824
  • https://openalex.org/W2251958591
  • https://openalex.org/W2949709688
  • https://openalex.org/W2950426098
  • https://openalex.org/W3025429056
  • https://openalex.org/W3146306708