Published January 1, 2021 | Version v1
Publication Open

Extractive Research Slide Generation Using Windowed Labeling Ranking

  • 1. Pennsylvania State University
  • 2. Dominion University College
  • 3. Old Dominion University

Description

Presentation slides describing the content of scientific and technical papers are an efficient and effective way to present that work.However, manually generating presentation slides is labor intensive.We propose a method to automatically generate slides for scientific papers based on a corpus of 5000 paper-slide pairs compiled from conference proceedings websites.The sentence labeling module of our method is based on SummaRuNNer, a neural sequence model for extractive summarization.Instead of ranking sentences based on semantic similarities in the whole document, our algorithm measures importance and novelty of sentences by combining semantic and lexical features within a sentence window.Our method outperforms several baseline methods including SummaRuNNer by a significant margin in terms of ROUGE score.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

شرائح العرض التقديمي التي تصف محتوى الأوراق العلمية والتقنية هي طريقة فعالة وفعالة لتقديم هذا العمل. ومع ذلك، فإن إنشاء شرائح العرض التقديمي يدويًا يتطلب جهدًا كبيرًا. نقترح طريقة لإنشاء شرائح للأوراق العلمية تلقائيًا بناءً على مجموعة من 5000 زوج من الشرائح الورقية تم تجميعها من مواقع وقائع المؤتمرات. تعتمد وحدة تصنيف الجمل في طريقتنا على SummaRuNNer، وهو نموذج تسلسل عصبي للتلخيص الاستخراجي. بدلاً من ترتيب الجمل بناءً على أوجه التشابه الدلالية في المستند بأكمله، تقيس خوارزميتنا أهمية الجمل وحداثتها من خلال الجمع بين السمات الدلالية والمعجمية داخل نافذة الجملة. تتفوق طريقتنا على العديد من طرق خط الأساس بما في ذلك SummaRuNer بهامش كبير من حيث درجة الحمر.

Translated Description (French)

Les diapositives de présentation décrivant le contenu des documents scientifiques et techniques sont un moyen efficace et efficient de présenter ce travail. Cependant, la génération manuelle de diapositives de présentation est laborieuse. Nous proposons une méthode de génération automatique de diapositives pour les documents scientifiques basée sur un corpus de 5 000 paires de diapositives papier compilées à partir de sites Web de comptes rendus de conférences. Le module d'étiquetage des phrases de notre méthode est basé sur SummaRuNNer, un modèle de séquence neuronale pour la synthèse extractive. Au lieu de classer les phrases en fonction des similitudes sémantiques dans l'ensemble du document, notre algorithme mesure l'importance et la nouveauté des phrases en combinant les caractéristiques sémantiques sémantiques et lexicales dans une fenêtre de phrases. Notre méthode surpasse plusieurs méthodes de base, y compris SummaRuNNer par une marge significative en termes de score ROUGE.

Translated Description (Spanish)

Las diapositivas de presentación que describen el contenido de los artículos científicos y técnicos son una forma eficiente y eficaz de presentar ese trabajo. Sin embargo, la generación manual de diapositivas de presentación requiere mucha mano de obra. Proponemos un método para generar automáticamente diapositivas para artículos científicos basado en un corpus de 5000 pares de diapositivas de papel compilados a partir de sitios web de actas de conferencias. El módulo de etiquetado de oraciones de nuestro método se basa en SummaRuNNer, un modelo de secuencia neuronal para el resumen extractivo. En lugar de clasificar oraciones basadas en similitudes semánticas en todo el documento, nuestro algoritmo mide la importancia y la novedad de las oraciones combinando características semánticas y léxicas dentro de una ventana de oraciones. Nuestro método supera varios métodos de referencia, incluido SummaRuNNer, por un margen significativo en términos de puntuación ROUGE.

Files

2021.sdp-1.11.pdf.pdf

Files (644.7 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:3c4be2f34c81a7c3c161d103788495c2
644.7 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
توليد شرائح البحوث الاستخراجية باستخدام تصنيف العلامات النافذة
Translated title (French)
Génération de diapositives de recherche extractive à l'aide d'un classement d'étiquetage à fenêtre
Translated title (Spanish)
Generación de diapositivas de investigación extractiva utilizando la clasificación de etiquetado en ventanas

Identifiers

Other
https://openalex.org/W3166396986
DOI
10.18653/v1/2021.sdp-1.11

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Ghana

References

  • https://openalex.org/W2970263339