Published September 1, 2023 | Version v1
Publication

An explainable ensemble of multi-view deep learning model for fake review detection

  • 1. University of Tasmania
  • 2. Al Ain University of Science and Technology
  • 3. Jordan University of Science and Technology
  • 4. Camden and Campbelltown Hospitals
  • 5. UNSW Sydney

Description

Online reviews significantly impact consumers who are purchasing or seeking services via the Internet. Businesses and review platforms need to manage these online reviews to avoid misleading customers through fake ones. This necessitates developing intelligent solutions to detect these fake reviews and prevent their negative impact on businesses and customers. Therefore, many fake review detection models have been proposed to help distinguish fake reviews from genuine ones. However, these techniques depend on a limited perspective of features, mainly review content, to detect fake reviews, leading to poor performance in discovering the new patterns of fake review content and the dynamic behaviour of spammers. Therefore, there is still a need to develop new solutions to detect the new patterns of fake reviews. Hence, this paper proposes an explainable multi-view deep learning model to identify fake reviews based on different feature perspectives and classifiers. The proposed model can extract essential features from different perspectives, including review content, reviewer data, and product description. Moreover, we employ an ensemble approach that combines three popular deep learning algorithms: Bi-LSTM, CNN, and DNN, to enhance the performance of the fake review detection model. The results of two real-life datasets presented demonstrated the efficiency of our proposed model, where it outperformed the state-of-the-art methods with improvements ranging from 1% to 7% in terms of the AUC metric. To provide visibility into the outcomes of our proposed model and demonstrate the trust and transparency in the obtained results, we also offer a comprehensive explanation for our model results using Shapely Additive Explanations (SHAP) method and attention techniques. The experimental results prove that our proposed model can provide reasonable explanations that help users understand why specific reviews are classified as fake.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تؤثر المراجعات عبر الإنترنت بشكل كبير على المستهلكين الذين يشترون أو يبحثون عن خدمات عبر الإنترنت. تحتاج الشركات ومنصات التقييم إلى إدارة هذه التقييمات عبر الإنترنت لتجنب تضليل العملاء من خلال التقييمات المزيفة. وهذا يتطلب تطوير حلول ذكية للكشف عن هذه المراجعات المزيفة ومنع تأثيرها السلبي على الشركات والعملاء. لذلك، تم اقتراح العديد من نماذج الكشف عن المراجعات المزيفة للمساعدة في التمييز بين المراجعات المزيفة والمراجعات الحقيقية. ومع ذلك، تعتمد هذه التقنيات على منظور محدود للميزات، وخاصة محتوى المراجعة، للكشف عن المراجعات المزيفة، مما يؤدي إلى ضعف الأداء في اكتشاف الأنماط الجديدة لمحتوى المراجعة المزيف والسلوك الديناميكي لمرسلي البريد العشوائي. لذلك، لا تزال هناك حاجة لتطوير حلول جديدة للكشف عن الأنماط الجديدة للمراجعات المزيفة. وبالتالي، تقترح هذه الورقة نموذج تعلم عميق متعدد وجهات النظر قابل للتفسير لتحديد المراجعات المزيفة بناءً على وجهات نظر ومصنفات مختلفة. يمكن للنموذج المقترح استخراج الميزات الأساسية من وجهات نظر مختلفة، بما في ذلك محتوى المراجعة وبيانات المراجع ووصف المنتج. علاوة على ذلك، نستخدم نهجًا جماعيًا يجمع بين ثلاث خوارزميات شائعة للتعلم العميق: Bi - LSTM و CNN و DNN، لتعزيز أداء نموذج اكتشاف المراجعة المزيفة. أظهرت نتائج مجموعتي البيانات الواقعية المقدمة كفاءة نموذجنا المقترح، حيث تفوقت على أحدث الأساليب مع تحسينات تتراوح من 1 ٪ إلى 7 ٪ من حيث مقياس الجامعة الأمريكية بالقاهرة. لتوفير رؤية لنتائج نموذجنا المقترح وإظهار الثقة والشفافية في النتائج التي تم الحصول عليها، نقدم أيضًا شرحًا شاملاً لنتائج نموذجنا باستخدام طريقة التفسيرات المضافة الشكلية (SHAP) وتقنيات الانتباه. تثبت النتائج التجريبية أن نموذجنا المقترح يمكن أن يقدم تفسيرات معقولة تساعد المستخدمين على فهم سبب تصنيف مراجعات محددة على أنها مزيفة.

Translated Description (French)

Les avis en ligne ont un impact significatif sur les consommateurs qui achètent ou recherchent des services via Internet. Les entreprises et les plateformes d'avis doivent gérer ces avis en ligne pour éviter d'induire les clients en erreur par le biais de faux avis. Cela nécessite de développer des solutions intelligentes pour détecter ces faux avis et prévenir leur impact négatif sur les entreprises et les clients. Par conséquent, de nombreux modèles de détection de faux avis ont été proposés pour aider à distinguer les faux avis des vrais. Cependant, ces techniques dépendent d'une perspective limitée des fonctionnalités, principalement du contenu des avis, pour détecter les faux avis, ce qui entraîne de mauvaises performances dans la découverte des nouveaux modèles de faux contenus d'avis et du comportement dynamique des spammeurs. Par conséquent, il est toujours nécessaire de développer de nouvelles solutions pour détecter les nouveaux modèles de faux avis. Par conséquent, cet article propose un modèle d'apprentissage profond à vues multiples explicable pour identifier les faux avis en fonction de différentes perspectives et classificateurs de fonctionnalités. Le modèle proposé peut extraire des caractéristiques essentielles de différentes perspectives, y compris le contenu de l'évaluation, les données de l'évaluateur et la description du produit. De plus, nous utilisons une approche d'ensemble qui combine trois algorithmes d'apprentissage profond populaires : Bi-LSTM, CNN et DNN, pour améliorer les performances du modèle de détection des faux avis. Les résultats de deux ensembles de données de la vie réelle présentés ont démontré l'efficacité de notre modèle proposé, où il a surpassé les méthodes de pointe avec des améliorations allant de 1 % à 7 % en termes de mesure de l'ASC. Pour fournir une visibilité sur les résultats de notre modèle proposé et démontrer la confiance et la transparence dans les résultats obtenus, nous proposons également une explication complète des résultats de notre modèle à l'aide de la méthode SHAP (Shapely Additive Explanations) et des techniques d'attention. Les résultats expérimentaux prouvent que notre modèle proposé peut fournir des explications raisonnables qui aident les utilisateurs à comprendre pourquoi des avis spécifiques sont classés comme faux.

Translated Description (Spanish)

Las reseñas en línea tienen un impacto significativo en los consumidores que compran o buscan servicios a través de Internet. Las empresas y las plataformas de reseñas deben gestionar estas reseñas en línea para evitar engañar a los clientes a través de reseñas falsas. Esto requiere desarrollar soluciones inteligentes para detectar estas reseñas falsas y evitar su impacto negativo en las empresas y los clientes. Por lo tanto, se han propuesto muchos modelos de detección de reseñas falsas para ayudar a distinguir las reseñas falsas de las genuinas. Sin embargo, estas técnicas dependen de una perspectiva limitada de las características, principalmente el contenido de reseñas, para detectar reseñas falsas, lo que lleva a un bajo rendimiento en el descubrimiento de los nuevos patrones de contenido de reseñas falsas y el comportamiento dinámico de los spammers. Por lo tanto, todavía existe la necesidad de desarrollar nuevas soluciones para detectar los nuevos patrones de reseñas falsas. Por lo tanto, este documento propone un modelo de aprendizaje profundo multivista explicable para identificar revisiones falsas basadas en diferentes perspectivas y clasificadores de características. El modelo propuesto puede extraer características esenciales desde diferentes perspectivas, incluido el contenido de la revisión, los datos del revisor y la descripción del producto. Además, empleamos un enfoque de conjunto que combina tres algoritmos populares de aprendizaje profundo: Bi-LSTM, CNN y DNN, para mejorar el rendimiento del modelo de detección de revisiones falsas. Los resultados de dos conjuntos de datos de la vida real presentados demostraron la eficiencia de nuestro modelo propuesto, donde superó a los métodos más avanzados con mejoras que van del 1% al 7% en términos de la métrica AUC. Para proporcionar visibilidad de los resultados de nuestro modelo propuesto y demostrar la confianza y transparencia en los resultados obtenidos, también ofrecemos una explicación completa de los resultados de nuestro modelo utilizando el método Shapely Additive Explanations (SHAP) y las técnicas de atención. Los resultados experimentales demuestran que nuestro modelo propuesto puede proporcionar explicaciones razonables que ayudan a los usuarios a comprender por qué las reseñas específicas se clasifican como falsas.

Additional details

Additional titles

Translated title (Arabic)
مجموعة قابلة للشرح من نموذج التعلم العميق متعدد المشاهدات للكشف عن المراجعة المزيفة
Translated title (French)
Un ensemble explicable de modèle d'apprentissage profond à vues multiples pour la détection de faux avis
Translated title (Spanish)
Un conjunto explicable de modelo de aprendizaje profundo multivista para la detección de revisiones falsas

Identifiers

Other
https://openalex.org/W4383102467
DOI
10.1016/j.jksuci.2023.101644

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Jordan

References

  • https://openalex.org/W1851422430
  • https://openalex.org/W1977764012
  • https://openalex.org/W1993318811
  • https://openalex.org/W1997157351
  • https://openalex.org/W2016266039
  • https://openalex.org/W2064058256
  • https://openalex.org/W2079735306
  • https://openalex.org/W2084103650
  • https://openalex.org/W2103063352
  • https://openalex.org/W2108564850
  • https://openalex.org/W2148143831
  • https://openalex.org/W2151496550
  • https://openalex.org/W2251645975
  • https://openalex.org/W2265846598
  • https://openalex.org/W2295506680
  • https://openalex.org/W2561920916
  • https://openalex.org/W2569238137
  • https://openalex.org/W2591945600
  • https://openalex.org/W2604992511
  • https://openalex.org/W2780698117
  • https://openalex.org/W2782266118
  • https://openalex.org/W2782919937
  • https://openalex.org/W2794855269
  • https://openalex.org/W2798859316
  • https://openalex.org/W2804019762
  • https://openalex.org/W2804338221
  • https://openalex.org/W2884308759
  • https://openalex.org/W2898130023
  • https://openalex.org/W2898743891
  • https://openalex.org/W2912484932
  • https://openalex.org/W2949541494
  • https://openalex.org/W2950944846
  • https://openalex.org/W2951307134
  • https://openalex.org/W2960168849
  • https://openalex.org/W2963115556
  • https://openalex.org/W2966854934
  • https://openalex.org/W2969767421
  • https://openalex.org/W2970641574
  • https://openalex.org/W2984197274
  • https://openalex.org/W2986387098
  • https://openalex.org/W2990236433
  • https://openalex.org/W2994994109
  • https://openalex.org/W2996568036
  • https://openalex.org/W3002750555
  • https://openalex.org/W3003718262
  • https://openalex.org/W3011436912
  • https://openalex.org/W3014572588
  • https://openalex.org/W3020180950
  • https://openalex.org/W3022483099
  • https://openalex.org/W3031745934
  • https://openalex.org/W3084223102
  • https://openalex.org/W3099739484
  • https://openalex.org/W3111343554
  • https://openalex.org/W4210580280
  • https://openalex.org/W4252566574
  • https://openalex.org/W4324135233