Published January 1, 2020 | Version v1
Publication Open

Early Detection of Fake News by Utilizing the Credibility of News, Publishers, and Users based on Weakly Supervised Learning

  • 1. Institute of Information Engineering
  • 2. Chinese Academy of Sciences
  • 3. University of Chinese Academy of Sciences

Description

The dissemination of fake news significantly affects personal reputation and public trust.Recently, fake news detection has attracted tremendous attention, and previous studies mainly focused on finding clues from news content or diffusion path.However, the required features of previous models are often unavailable or insufficient in early detection scenarios, resulting in poor performance.Thus, early fake news detection remains a tough challenge.Intuitively, the news from trusted and authoritative sources or shared by many users with a good reputation is more reliable than other news.Using the credibility of publishers and users as prior weakly supervised information, we can quickly locate fake news in massive news and detect them in the early stages of dissemination.In this paper, we propose a novel Structure-aware Multi-head Attention Network (SMAN), which combines the news content, publishing, and reposting relations of publishers and users, to jointly optimize the fake news detection and credibility prediction tasks.In this way, we can explicitly exploit the credibility of publishers and users for early fake news detection.We conducted experiments on three real-world datasets, and the results show that SMAN can detect fake news in 4 hours with an accuracy of over 91%, which is much faster than the state-of-the-art models.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يؤثر نشر الأخبار المزيفة بشكل كبير على السمعة الشخصية وثقة الجمهور. في الآونة الأخيرة، اجتذب اكتشاف الأخبار المزيفة اهتمامًا هائلاً، وركزت الدراسات السابقة بشكل أساسي على العثور على أدلة من المحتوى الإخباري أو مسار النشر. ومع ذلك، غالبًا ما تكون الميزات المطلوبة للنماذج السابقة غير متوفرة أو غير كافية في سيناريوهات الكشف المبكر، مما يؤدي إلى ضعف الأداء. وبالتالي، لا يزال الكشف المبكر عن الأخبار المزيفة يمثل تحديًا صعبًا. بشكل بديهي، فإن الأخبار من مصادر موثوقة وموثوقة أو التي يشاركها العديد من المستخدمين ذوي السمعة الطيبة أكثر موثوقية من الأخبار الأخرى. مصداقية الناشرين والمستخدمين كمعلومات سابقة خاضعة للإشراف الضعيف، يمكننا تحديد موقع الأخبار المزيفة بسرعة في الأخبار الضخمة واكتشافها في المراحل المبكرة من النشر. في هذه الورقة، نقترح شبكة انتباه متعددة الرؤوس مدركة للهيكل (SMAN)، والتي تجمع بين محتوى الأخبار والنشر وإعادة نشر العلاقات بين الناشرين والمستخدمين، لتحسين مهام الكشف عن الأخبار المزيفة والتنبؤ بالمصداقية بشكل مشترك. وبهذه الطريقة، يمكننا استغلال مصداقية الناشرين والمستخدمين بشكل صريح للكشف المبكر عن الأخبار المزيفة. أجرينا تجارب على ثلاث مجموعات بيانات في العالم الحقيقي، و تظهر النتائج أن SMAN يمكنها اكتشاف الأخبار المزيفة في 4 ساعات بدقة تزيد عن 91 ٪، وهي أسرع بكثير من النماذج الحديثة.

Translated Description (French)

La diffusion de fausses nouvelles affecte considérablement la réputation personnelle et la confiance du public.Récemment, la détection des fausses nouvelles a attiré énormément d'attention, et les études précédentes se sont principalement concentrées sur la recherche d'indices à partir du contenu des nouvelles ou du chemin de diffusion.Toutefois, les fonctionnalités requises des modèles précédents sont souvent indisponibles ou insuffisantes dans les scénarios de détection précoce, ce qui entraîne de mauvaises performances.Par conséquent, la détection précoce des fausses nouvelles reste un défi difficile.Intuitivement, les nouvelles provenant de sources fiables et faisant autorité ou partagées par de nombreux utilisateurs ayant une bonne réputation sont plus fiables que les autres nouvelles.Utilisation la crédibilité des éditeurs et des utilisateurs en tant qu'informations préalables faiblement supervisées, nous pouvons rapidement localiser les fausses nouvelles dans les informations massives et les détecter aux premiers stades de la diffusion. Dans cet article, nous proposons un nouveau réseau d'attention multi-têtes (SMAN) sensible à la structure, qui combine le contenu des informations, la publication et les relations de republication des éditeurs et des utilisateurs, afin d'optimiser conjointement les tâches de détection des fausses nouvelles et de prédiction de la crédibilité. De cette façon, nous pouvons exploiter explicitement la crédibilité des éditeurs et des utilisateurs pour la détection précoce des fausses nouvelles. Nous avons mené des expériences sur trois ensembles de données du monde réel, et le les résultats montrent que SMAN peut détecter les fausses nouvelles en 4 heures avec une précision de plus de 91 %, ce qui est beaucoup plus rapide que les modèles de pointe.

Translated Description (Spanish)

La difusión de noticias falsas afecta significativamente la reputación personal y la confianza del público. Recientemente, la detección de noticias falsas ha atraído una gran atención, y los estudios previos se centraron principalmente en encontrar pistas del contenido de las noticias o la ruta de difusión. Sin embargo, las características requeridas de los modelos anteriores a menudo no están disponibles o son insuficientes en los escenarios de detección temprana, lo que resulta en un rendimiento deficiente. Por lo tanto, la detección temprana de noticias falsas sigue siendo un desafío difícil. Intuitivamente, las noticias de fuentes confiables y autorizadas o compartidas por muchos usuarios con una buena reputación son más confiables que otras noticias. la credibilidad de los editores y usuarios como información previa débilmente supervisada, podemos localizar rápidamente noticias falsas en noticias masivas y detectarlas en las primeras etapas de difusión. En este documento, proponemos una novedosa Red de atención multicabeza (SMAN) consciente de la estructura, que combina el contenido de las noticias, la publicación y las relaciones de reenvío de editores y usuarios, para optimizar conjuntamente la detección de noticias falsas y las tareas de predicción de credibilidad. De esta manera, podemos explotar explícitamente la credibilidad de los editores y usuarios para la detección temprana de noticias falsas. Realizamos experimentos en tres conjuntos de datos del mundo real y el Los resultados muestran que SMAN puede detectar noticias falsas en 4 horas con una precisión de más del 91%, lo que es mucho más rápido que los modelos más avanzados.

Files

2020.coling-main.475.pdf.pdf

Files (226 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:5360980bad11bf9723da89687501effc
226 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
الكشف المبكر عن الأخبار المزيفة من خلال الاستفادة من مصداقية الأخبار والناشرين والمستخدمين بناءً على التعلم الخاضع للإشراف الضعيف
Translated title (French)
Détection précoce des fausses nouvelles en utilisant la crédibilité des nouvelles, des éditeurs et des utilisateurs basée sur un apprentissage faiblement supervisé
Translated title (Spanish)
Detección temprana de noticias falsas mediante la utilización de la credibilidad de las noticias, los editores y los usuarios basada en el aprendizaje débilmente supervisado

Identifiers

Other
https://openalex.org/W3117172199
DOI
10.18653/v1/2020.coling-main.475

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W1533861849
  • https://openalex.org/W1638051351
  • https://openalex.org/W1832693441
  • https://openalex.org/W1975594555
  • https://openalex.org/W2032897813
  • https://openalex.org/W2084591134
  • https://openalex.org/W2120615054
  • https://openalex.org/W2124637344
  • https://openalex.org/W2142869398
  • https://openalex.org/W2153579005
  • https://openalex.org/W2241850672
  • https://openalex.org/W2424495361
  • https://openalex.org/W2470673105
  • https://openalex.org/W2577716227
  • https://openalex.org/W2577888896
  • https://openalex.org/W2593408211
  • https://openalex.org/W2741930413
  • https://openalex.org/W2742144412
  • https://openalex.org/W2785523195
  • https://openalex.org/W2788235048
  • https://openalex.org/W2790166049
  • https://openalex.org/W2798640866
  • https://openalex.org/W2798787718
  • https://openalex.org/W2810026022
  • https://openalex.org/W2897757923
  • https://openalex.org/W2899771611
  • https://openalex.org/W2906971970
  • https://openalex.org/W2945804568
  • https://openalex.org/W2951288507
  • https://openalex.org/W2963403868
  • https://openalex.org/W2998395006
  • https://openalex.org/W3004200020