A Unified Framework for Creating Domain Dependent Polarity Lexicons from User Generated Reviews
- 1. Gomal University
 - 2. University of Science and Technology Bannu
 - 3. King Abdul Aziz University Hospital
 - 4. COMSATS University Islamabad
 
Description
The exponential increase in the explosion of Web-based user generated reviews has resulted in the emergence of Opinion Mining (OM) applications for analyzing the users' opinions toward products, services, and policies. The polarity lexicons often play a pivotal role in the OM, indicating the positivity and negativity of a term along with the numeric score. However, the commonly available domain independent lexicons are not an optimal choice for all of the domains within the OM applications. The aforementioned is due to the fact that the polarity of a term changes from one domain to other and such lexicons do not contain the correct polarity of a term for every domain. In this work, we focus on the problem of adapting a domain dependent polarity lexicon from set of labeled user reviews and domain independent lexicon to propose a unified learning framework based on the information theory concepts that can assign the terms with correct polarity (+ive, -ive) scores. The benchmarking on three datasets (car, hotel, and drug reviews) shows that our approach improves the performance of the polarity classification by achieving higher accuracy. Moreover, using the derived domain dependent lexicon changed the polarity of terms, and the experimental results show that our approach is more effective than the base line methods.
Translated Descriptions
Translated Description (Arabic)
أدت الزيادة الهائلة في انفجار المراجعات التي أنشأها المستخدمون على شبكة الإنترنت إلى ظهور تطبيقات تعدين الآراء (OM) لتحليل آراء المستخدمين تجاه المنتجات والخدمات والسياسات. غالبًا ما تلعب معاجم القطبية دورًا محوريًا في OM، مما يشير إلى إيجابية وسلبية المصطلح جنبًا إلى جنب مع النتيجة الرقمية. ومع ذلك، فإن المعاجم المستقلة للمجال المتاحة بشكل شائع ليست خيارًا مثاليًا لجميع المجالات داخل تطبيقات OM. يرجع ما سبق إلى حقيقة أن قطبية المصطلح تتغير من مجال إلى آخر وأن هذه المعاجم لا تحتوي على القطبية الصحيحة لمصطلح لكل مجال. في هذا العمل، نركز على مشكلة تكييف معجم القطبية المعتمد على المجال من مجموعة من مراجعات المستخدمين المسماة والمعجم المستقل للمجال لاقتراح إطار تعليمي موحد يعتمد على مفاهيم نظرية المعلومات التي يمكن أن تعين المصطلحات مع درجات القطبية الصحيحة (+ive، - ive). تُظهر المقارنة المعيارية لثلاث مجموعات بيانات (مراجعات السيارات والفنادق والأدوية) أن نهجنا يحسن أداء تصنيف القطبية من خلال تحقيق دقة أعلى. علاوة على ذلك، أدى استخدام المعجم المعتمد على المجال المشتق إلى تغيير قطبية المصطلحات، وتظهر النتائج التجريبية أن نهجنا أكثر فعالية من طرق خط الأساس.Translated Description (French)
L'augmentation exponentielle de l'explosion des avis générés par les utilisateurs sur le Web a entraîné l'émergence d'applications d'Opinion Mining (OM) pour analyser les opinions des utilisateurs sur les produits, les services et les politiques. Les lexiques de polarité jouent souvent un rôle central dans l'OM, indiquant la positivité et la négativité d'un terme avec le score numérique. Cependant, les lexiques indépendants des domaines couramment disponibles ne sont pas un choix optimal pour tous les domaines au sein des applications OM. Ce qui précède est dû au fait que la polarité d'un terme change d'un domaine à l'autre et que ces lexiques ne contiennent pas la polarité correcte d'un terme pour chaque domaine. Dans ce travail, nous nous concentrons sur le problème de l'adaptation d'un lexique de polarité dépendante du domaine à partir d'un ensemble d'avis d'utilisateurs étiquetés et d'un lexique indépendant du domaine pour proposer un cadre d'apprentissage unifié basé sur les concepts de la théorie de l'information qui peut attribuer les termes avec des scores de polarité corrects (+ive, -ive). L'analyse comparative de trois ensembles de données (critiques de voitures, d'hôtels et de médicaments) montre que notre approche améliore les performances de la classification de polarité en obtenant une plus grande précision. De plus, l'utilisation du lexique dérivé dépendant du domaine a changé la polarité des termes, et les résultats expérimentaux montrent que notre approche est plus efficace que les méthodes de base.Translated Description (Spanish)
El aumento exponencial en la explosión de reseñas generadas por usuarios basados en la Web ha dado lugar a la aparición de aplicaciones de Minería de Opinión (OM) para analizar las opiniones de los usuarios hacia productos, servicios y políticas. Los léxicos de polaridad a menudo desempeñan un papel fundamental en la OM, lo que indica la positividad y negatividad de un término junto con la puntuación numérica. Sin embargo, los léxicos independientes de dominio comúnmente disponibles no son una opción óptima para todos los dominios dentro de las aplicaciones OM. Lo anterior se debe a que la polaridad de un término cambia de un dominio a otro y dichos léxicos no contienen la polaridad correcta de un término para cada dominio. En este trabajo, nos centramos en el problema de adaptar un léxico de polaridad dependiente del dominio a partir de un conjunto de reseñas de usuarios etiquetadas y un léxico independiente del dominio para proponer un marco de aprendizaje unificado basado en los conceptos de la teoría de la información que pueda asignar los términos con las puntuaciones correctas de polaridad (+ive, -ive). La evaluación comparativa de tres conjuntos de datos (Car, hotel y revisiones de medicamentos) muestra que nuestro enfoque mejora el rendimiento de la clasificación de polaridad al lograr una mayor precisión. Además, el uso del léxico dependiente del dominio derivado cambió la polaridad de los términos, y los resultados experimentales muestran que nuestro enfoque es más efectivo que los métodos de línea de base.Files
      
        journal.pone.0140204&type=printable.pdf
        
      
    
    
      
        Files
         (763.1 kB)
        
      
    
    | Name | Size | Download all | 
|---|---|---|
| 
          
          md5:304795713c6407d80a42fdc1a0b3a857
           | 
        
        763.1 kB | Preview Download | 
Additional details
Additional titles
- Translated title (Arabic)
 - إطار موحد لإنشاء معاجم القطبية المعتمدة على المجال من المراجعات التي ينشئها المستخدمون
 - Translated title (French)
 - Un cadre unifié pour la création de lexiques de polarité dépendants du domaine à partir des avis générés par les utilisateurs
 - Translated title (Spanish)
 - Un marco unificado para crear léxicos de polaridad dependientes del dominio a partir de revisiones generadas por el usuario
 
Identifiers
- Other
 - https://openalex.org/W2199793267
 - DOI
 - 10.1371/journal.pone.0140204
 
            
              References
            
          
        - https://openalex.org/W1549434858
 - https://openalex.org/W1973375669
 - https://openalex.org/W1981716768
 - https://openalex.org/W1993260179
 - https://openalex.org/W2012070465
 - https://openalex.org/W2014281255
 - https://openalex.org/W2016207542
 - https://openalex.org/W2040233874
 - https://openalex.org/W2043616274
 - https://openalex.org/W2055103902
 - https://openalex.org/W2081580037
 - https://openalex.org/W2084046180
 - https://openalex.org/W2089173648
 - https://openalex.org/W2108765529
 - https://openalex.org/W2130808938
 - https://openalex.org/W2131305515
 - https://openalex.org/W2136680862
 - https://openalex.org/W2145955806
 - https://openalex.org/W2146111747
 - https://openalex.org/W2152479110
 - https://openalex.org/W2155328222
 - https://openalex.org/W2181912024
 - https://openalex.org/W2274323834
 - https://openalex.org/W2334845723
 - https://openalex.org/W4312789226
 - https://openalex.org/W50799546