Published January 1, 2020 | Version v1
Publication Open

A Spectral Method for Unsupervised Multi-Document Summarization

  • 1. Peking University
  • 2. Peng Cheng Laboratory

Description

Multi-document summarization (MDS) aims at producing a good-quality summary for several related documents.In this paper, we propose a spectral-based hypothesis, which states that the goodness of summary candidate is closely linked to its so-called spectral impact.Here spectral impact considers the perturbation to the dominant eigenvalue of affinity matrix when dropping the summary candidate from the document cluster.The hypothesis is validated by three theoretical perspectives: semantic scaling, propagation dynamics and matrix perturbation.According to the hypothesis, we formulate the MDS task as the combinatorial optimization of spectral impact and propose an accelerated greedy solution based on a surrogate of spectral impact.The evaluation results on various datasets demonstrate:(1) The performance of the summary candidate is positively correlated with its spectral impact, which accords with our hypothesis; (2) Our spectral-based method has a competitive result as compared to state-of-the-art MDS systems.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يهدف التلخيص متعدد الوثائق (MDS) إلى إنتاج ملخص عالي الجودة للعديد من الوثائق ذات الصلة. في هذه الورقة، نقترح فرضية قائمة على الطيف، والتي تنص على أن صلاح مرشح الملخص يرتبط ارتباطًا وثيقًا بما يسمى التأثير الطيفي. هنا يأخذ التأثير الطيفي في الاعتبار الاضطراب في القيمة الذاتية السائدة لمصفوفة التقارب عند إسقاط مرشح الملخص من مجموعة المستندات. يتم التحقق من صحة الفرضية من خلال ثلاث وجهات نظر نظرية: القياس الدلالي وديناميكيات الانتشار واضطراب المصفوفة. وفقًا للفرضية، نقوم بصياغة مهمة MDS على أنها التحسين التوافقي للتأثير الطيفي واقتراح حل جشع متسارع بناءً على بديل للتأثير الطيفي. توضح نتائج التقييم على مجموعات البيانات المختلفة:(1) يرتبط أداء مرشح الملخص ارتباطًا إيجابيًا بتأثيره الطيفي، والذي يتوافق مع فرضيتنا ؛ (2) طريقتنا القائمة على الطيف لها نتيجة تنافسية مقارنةً بأنظمة MDS.

Translated Description (French)

La synthèse multi-documentaire (Mds) vise à produire un résumé de bonne qualité pour plusieurs documents connexes. Dans cet article, nous proposons une hypothèse basée sur le spectre, qui stipule que la qualité du candidat sommaire est étroitement liée à son impact dit spectral. Ici, l'impact spectral considère la perturbation de la valeur propre dominante de la matrice d'affinité lors de l'abandon du candidat sommaire du groupe de documents. L'hypothèse est validée par trois perspectives théoriques : mise à l'échelle sémantique, dynamique de propagation et perturbation matricielle. Selon l'hypothèse, nous formulons la tâche Mds comme l'optimisation combinatoire de l'impact spectral et proposons une solution gourmande accélérée basée sur un substitut de l'impact spectral. Les résultats d'évaluation sur divers ensembles de données démontrent :(1) La performance du candidat sommaire est positivement corrélée à son impact spectral, ce qui correspond à notre hypothèse ; (2) Notre méthode basée sur le spectre a un résultat compétitif par rapport aux systèmes Mds de pointe.

Translated Description (Spanish)

El resumen multidocumental (MDS) tiene como objetivo producir un resumen de buena calidad para varios documentos relacionados. En este documento, proponemos una hipótesis basada en espectros, que establece que la bondad del candidato resumido está estrechamente vinculada a su llamado impacto espectral. Aquí el impacto espectral considera la perturbación del valor propio dominante de la matriz de afinidad al eliminar al candidato resumido del clúster de documentos. La hipótesis se valida mediante tres perspectivas teóricas: escalado semántico, dinámica de propagación y perturbación de la matriz. De acuerdo con la hipótesis, formulamos la tarea MDS como la optimización combinatoria del impacto espectral y proponemos una solución codiciosa acelerada basada en un sustituto del impacto espectral. Los resultados de la evaluación en varios conjuntos de datos demuestran:(1) El rendimiento del candidato resumido está correlacionado positivamente con su impacto espectral, lo que concuerda con nuestra hipótesis; (2) Nuestro método basado en espectros tiene un resultado competitivo en comparación con los sistemas MDS de última generación.

Files

2020.emnlp-main.32.pdf.pdf

Files (226 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:5360980bad11bf9723da89687501effc
226 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
طريقة طيفية للتلخيص متعدد الوثائق غير الخاضع للإشراف
Translated title (French)
Une méthode spectrale pour la synthèse multi-documents non supervisée
Translated title (Spanish)
Un método espectral para la resumición no supervisada de múltiples documentos

Identifiers

Other
https://openalex.org/W3100693043
DOI
10.18653/v1/2020.emnlp-main.32

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W2606974598
  • https://openalex.org/W2740656274
  • https://openalex.org/W2757254625
  • https://openalex.org/W2759479827
  • https://openalex.org/W2962946054
  • https://openalex.org/W2963204221
  • https://openalex.org/W2963341956
  • https://openalex.org/W2964144561
  • https://openalex.org/W2970795039