Published January 1, 2020 | Version v1
Publication Open

DivGAN: Towards Diverse Paraphrase Generation via Diversified Generative Adversarial Network

  • 1. Peking University

Description

Paraphrases refer to texts that convey the same meaning with different expression forms.Traditional seq2seq-based models on paraphrase generation mainly focus on the fidelity while ignoring the diversity of outputs.In this paper, we propose a deep generative model to generate diverse paraphrases.We build our model based on the conditional generative adversarial network, and propose to incorporate a simple yet effective diversity loss term into the model in order to improve the diversity of outputs.The proposed diversity loss maximizes the ratio of pairwise distance between the generated texts and their corresponding latent codes, forcing the generator to focus more on the latent codes and produce diverse samples.Experimental results on benchmarks of paraphrase generation show that our proposed model can generate more diverse paraphrases compared with baselines.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تشير إعادة الصياغة إلى النصوص التي تنقل نفس المعنى بأشكال تعبيرية مختلفة. تركز النماذج التقليدية القائمة على seq2seq على توليد إعادة الصياغة بشكل أساسي على الإخلاص مع تجاهل تنوع المخرجات. في هذه الورقة، نقترح نموذجًا توليديًا عميقًا لتوليد إعادة الصياغة المتنوعة. نبني نموذجنا بناءً على الشبكة العدائية التوليدية المشروطة، ونقترح دمج مصطلح فقدان التنوع البسيط والفعال في النموذج من أجل تحسين تنوع المخرجات. يزيد فقدان التنوع المقترح من نسبة المسافة الزوجية بين النصوص التي تم إنشاؤها والرموز الكامنة المقابلة لها، مما يجبر المولد على التركيز أكثر على الرموز الكامنة وإنتاج عينات متنوعة. تظهر النتائج التجريبية على معايير توليد إعادة الصياغة أن نموذجنا المقترح يمكن أن يولد المزيد من إعادة الصياغة المتنوعة مقارنة بخطوط الأساس.

Translated Description (French)

Les paraphrases se réfèrent à des textes qui transmettent le même sens avec différentes formes d'expression. Les modèles traditionnels basés sur seq2seq sur la génération de paraphrases se concentrent principalement sur la fidélité tout en ignorant la diversité des sorties. Dans cet article, nous proposons un modèle génératif profond pour générer diverses paraphrases. Nous construisons notre modèle sur la base du réseau contradictoire génératif conditionnel et proposons d'incorporer un terme de perte de diversité simple mais efficace dans le modèle afin d'améliorer la diversité des sorties. La perte de diversité proposée maximise le rapport de distance par paire entre les textes générés et leurs codes latents correspondants, forçant le générateur à se concentrer davantage sur les codes latents et à produire divers échantillons. Les résultats expérimentaux sur les repères de génération de paraphrases montrent que notre modèle proposé peut générer des paraphrases plus diverses par rapport aux lignes de base.

Translated Description (Spanish)

Las paráfrasis se refieren a textos que transmiten el mismo significado con diferentes formas de expresión. Los modelos tradicionales basados en seq2seq sobre la generación de paráfrasis se centran principalmente en la fidelidad mientras ignoran la diversidad de los resultados. En este documento, proponemos un modelo generativo profundo para generar diversas paráfrasis. Construimos nuestro modelo basado en la red adversaria generativa condicional y proponemos incorporar un término de pérdida de diversidad simple pero efectivo en el modelo para mejorar la diversidad de los resultados. La pérdida de diversidad propuesta maximiza la relación de distancia por pares entre los textos generados y sus códigos latentes correspondientes, lo que obliga al generador a centrarse más en los códigos latentes y producir diversas muestras. Los resultados experimentales en los puntos de referencia de la generación de paráfrasis muestran que nuestro modelo propuesto puede generar paráfrasis más diversas en comparación con las líneas de base.

Files

2020.findings-emnlp.218.pdf.pdf

Files (226 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:5360980bad11bf9723da89687501effc
226 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
DivGAN: نحو توليد إعادة صياغة متنوعة عبر شبكة خصومة توليدية متنوعة
Translated title (French)
DivGAN : Towards Diverse Paraphrase Generation via Diversified Generative Adversarial Network
Translated title (Spanish)
DivGAN: Hacia la generación diversa de paráfrasis a través de una red diversificada de adversarios generativos

Identifiers

Other
https://openalex.org/W3106530084
DOI
10.18653/v1/2020.findings-emnlp.218

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W1505629914
  • https://openalex.org/W1832693441
  • https://openalex.org/W1861492603
  • https://openalex.org/W2741049976
  • https://openalex.org/W2808437126
  • https://openalex.org/W2890771450
  • https://openalex.org/W2892153332
  • https://openalex.org/W2947683321
  • https://openalex.org/W2949830548
  • https://openalex.org/W2949832505
  • https://openalex.org/W2952481978
  • https://openalex.org/W2962953307
  • https://openalex.org/W2963001247
  • https://openalex.org/W2963126845
  • https://openalex.org/W2963506530
  • https://openalex.org/W2963903950
  • https://openalex.org/W2963941871
  • https://openalex.org/W2965280546
  • https://openalex.org/W2971116243