Published October 21, 2021 | Version v1
Publication

Deepfake tweets classification using stacked Bi-LSTM and words embedding

  • 1. Florida International University
  • 2. Khwaja Fareed University of Engineering and Information Technology
  • 3. Morehouse College
  • 4. Broward College
  • 5. Yeungnam University

Description

The spread of altered media in the form of fake videos, audios, and images, has been largely increased over the past few years. Advanced digital manipulation tools and techniques make it easier to generate fake content and post it on social media. In addition, tweets with deep fake content make their way to social platforms. The polarity of such tweets is significant to determine the sentiment of people about deep fakes. This paper presents a deep learning model to predict the polarity of deep fake tweets. For this purpose, a stacked bi-directional long short-term memory (SBi-LSTM) network is proposed to classify the sentiment of deep fake tweets. Several well-known machine learning classifiers are investigated as well such as support vector machine, logistic regression, Gaussian Naive Bayes, extra tree classifier, and AdaBoost classifier. These classifiers are utilized with term frequency-inverse document frequency and a bag of words feature extraction approaches. Besides, the performance of deep learning models is analyzed including long short-term memory network, gated recurrent unit, bi-direction LSTM, and convolutional neural network+LSTM. Experimental results indicate that the proposed SBi-LSTM outperforms both machine and deep learning models and achieves an accuracy of 0.92.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

زاد انتشار الوسائط المعدلة في شكل مقاطع فيديو وتسجيلات صوتية وصور مزيفة إلى حد كبير خلال السنوات القليلة الماضية. تسهل أدوات وتقنيات التلاعب الرقمي المتقدمة إنشاء محتوى مزيف ونشره على وسائل التواصل الاجتماعي. بالإضافة إلى ذلك، فإن التغريدات التي تحتوي على محتوى مزيف عميق تشق طريقها إلى المنصات الاجتماعية. إن قطبية مثل هذه التغريدات مهمة لتحديد مشاعر الناس حول التزييف العميق. تقدم هذه الورقة نموذجًا للتعلم العميق للتنبؤ بقطبية التغريدات المزيفة العميقة. لهذا الغرض، يتم اقتراح شبكة ذاكرة طويلة المدى ثنائية الاتجاه مكدسة (SBi - LSTM) لتصنيف مشاعر التغريدات المزيفة العميقة. يتم التحقيق في العديد من مصنفات التعلم الآلي المعروفة أيضًا مثل آلة ناقلات الدعم، والانحدار اللوجستي، و Gaussian Naive Bayes، ومصنف الأشجار الإضافي، ومصنف AdaBoost. يتم استخدام هذه المصنفات مع تكرار المستند المعكوس للتكرار وحقيبة من الكلمات التي تتميز بأساليب الاستخراج. إلى جانب ذلك، يتم تحليل أداء نماذج التعلم العميق بما في ذلك شبكة الذاكرة طويلة المدى، والوحدة المتكررة ذات البوابات، و LSTM ثنائي الاتجاه، والشبكة العصبية الالتفافية +LSTM. تشير النتائج التجريبية إلى أن SBi - LSTM المقترح يتفوق على كل من نماذج التعلم الآلي والتعلم العميق ويحقق دقة 0.92.

Translated Description (French)

La diffusion de médias modifiés sous la forme de fausses vidéos, d'audios et d'images a considérablement augmenté au cours des dernières années. Des outils et des techniques de manipulation numérique avancés facilitent la génération de faux contenus et leur publication sur les réseaux sociaux. De plus, les tweets avec un faux contenu profond se dirigent vers les plateformes sociales. La polarité de ces tweets est importante pour déterminer le sentiment des gens sur les contrefaçons profondes. Cet article présente un modèle d'apprentissage profond pour prédire la polarité des faux tweets profonds. À cette fin, un réseau de mémoire bidirectionnelle à long terme (SBi-LSTM) est proposé pour classer le sentiment de faux tweets profonds. Plusieurs classificateurs d'apprentissage automatique bien connus sont étudiés, tels que la machine vectorielle de support, la régression logistique, la naïve Bayes gaussienne, le classificateur arborescent supplémentaire et le classificateur AdaBoost. Ces classificateurs sont utilisés avec la fréquence de document inverse de la fréquence des termes et un sac de mots présente des approches d'extraction. En outre, la performance des modèles d'apprentissage profond est analysée, y compris le réseau de mémoire à long terme, l'unité récurrente fermée, le LSTM bidirectionnel et le réseau neuronal convolutionnel +LSTM. Les résultats expérimentaux indiquent que le SBi-LSTM proposé surpasse à la fois les modèles d'apprentissage machine et d'apprentissage profond et atteint une précision de 0,92.

Translated Description (Spanish)

La difusión de medios alterados en forma de videos, audios e imágenes falsas se ha incrementado en gran medida en los últimos años. Las herramientas y técnicas avanzadas de manipulación digital facilitan la generación de contenido falso y su publicación en las redes sociales. Además, los tweets con contenido profundamente falso llegan a las plataformas sociales. La polaridad de dichos tweets es significativa para determinar el sentimiento de las personas sobre las falsificaciones profundas. Este documento presenta un modelo de aprendizaje profundo para predecir la polaridad de los tweets falsos profundos. Para este propósito, se propone una red de memoria bidireccional apilada a largo plazo (SBi-LSTM) para clasificar el sentimiento de los tweets falsos profundos. También se investigan varios clasificadores de aprendizaje automático bien conocidos, como la máquina de vectores de soporte, la regresión logística, Gaussian Naive Bayes, el clasificador de árbol adicional y el clasificador AdaBoost. Estos clasificadores se utilizan con frecuencia de documentos inversa a la frecuencia de los términos y un conjunto de enfoques de extracción de características de palabras. Además, se analiza el rendimiento de los modelos de aprendizaje profundo, incluida la red de memoria a largo plazo, la unidad recurrente cerrada, el LSTM bidireccional y la red neuronal convolucional +LSTM. Los resultados experimentales indican que el SBi-LSTM propuesto supera los modelos de aprendizaje automático y profundo y logra una precisión de 0,92.

Additional details

Additional titles

Translated title (Arabic)
تصنيف تغريدات Deepfake باستخدام تقنية Bi - LSTM المكدسة وتضمين الكلمات
Translated title (French)
Classification des tweets Deepfake à l'aide de Bi-LSTM empilés et de l'intégration de mots
Translated title (Spanish)
Clasificación de tweets deepfake utilizando Bi-LSTM apilado e incrustación de palabras

Identifiers

Other
https://openalex.org/W3205067936
DOI
10.7717/peerj-cs.745

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Pakistan

References

  • https://openalex.org/W122568889
  • https://openalex.org/W1517678168
  • https://openalex.org/W1678356000
  • https://openalex.org/W168039245
  • https://openalex.org/W1924770834
  • https://openalex.org/W193524605
  • https://openalex.org/W2008642148
  • https://openalex.org/W2012070465
  • https://openalex.org/W2021137987
  • https://openalex.org/W2025478229
  • https://openalex.org/W2031253971
  • https://openalex.org/W2062346783
  • https://openalex.org/W2062913298
  • https://openalex.org/W2063998312
  • https://openalex.org/W2076063813
  • https://openalex.org/W2079281079
  • https://openalex.org/W2084046180
  • https://openalex.org/W2092880761
  • https://openalex.org/W2102909657
  • https://openalex.org/W2145073242
  • https://openalex.org/W2146111747
  • https://openalex.org/W2160660844
  • https://openalex.org/W2250879510
  • https://openalex.org/W23451747
  • https://openalex.org/W2401152200
  • https://openalex.org/W2417999172
  • https://openalex.org/W2440899416
  • https://openalex.org/W2515313226
  • https://openalex.org/W2546935677
  • https://openalex.org/W2732264101
  • https://openalex.org/W2792883466
  • https://openalex.org/W2907918833
  • https://openalex.org/W2946439493
  • https://openalex.org/W2949998441
  • https://openalex.org/W2951278869
  • https://openalex.org/W2963629121
  • https://openalex.org/W2988412621
  • https://openalex.org/W2989851933
  • https://openalex.org/W3010887396
  • https://openalex.org/W3015364190
  • https://openalex.org/W3017305345
  • https://openalex.org/W3041730883
  • https://openalex.org/W3083667980
  • https://openalex.org/W3090907849
  • https://openalex.org/W3131504710
  • https://openalex.org/W3132265016
  • https://openalex.org/W3133994440
  • https://openalex.org/W3134603203
  • https://openalex.org/W3164947024
  • https://openalex.org/W3167335427
  • https://openalex.org/W3176063860
  • https://openalex.org/W3195476276
  • https://openalex.org/W4320301321
  • https://openalex.org/W56794514
  • https://openalex.org/W810042281