Published January 1, 2020 | Version v1
Publication Open

Efficient Strategies for Hierarchical Text Classification: External Knowledge and Auxiliary Tasks

  • 1. University of Edinburgh
  • 2. Pontifical Catholic University of Peru
  • 3. Brazilian Society of Computational and Applied Mathematics
  • 4. Universidade de São Paulo

Description

In hierarchical text classification, we perform a sequence of inference steps to predict the category of a document from top to bottom of a given class taxonomy.Most of the studies have focused on developing novels neural network architectures to deal with the hierarchical structure, but we prefer to look for efficient ways to strengthen a baseline model.We first define the task as a sequence-to-sequence problem.Afterwards, we propose an auxiliary synthetic task of bottom-up-classification.Then, from external dictionaries, we retrieve textual definitions for the classes of all the hierarchy's layers, and map them into the word vector space.We use the class-definition embeddings as an additional input to condition the prediction of the next layer and in an adapted beam search.Whereas the modified search did not provide large gains, the combination of the auxiliary task and the additional input of classdefinitions significantly enhance the classification accuracy.With our efficient approaches, we outperform previous studies, using a drastically reduced number of parameters, in two well-known English datasets.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

في تصنيف النص الهرمي، نقوم بإجراء سلسلة من خطوات الاستدلال للتنبؤ بفئة المستند من أعلى إلى أسفل تصنيف فئة معينة. ركزت معظم الدراسات على تطوير أبنية الشبكات العصبية للروايات للتعامل مع الهيكل الهرمي، لكننا نفضل البحث عن طرق فعالة لتعزيز نموذج خط الأساس. نحدد المهمة أولاً كمشكلة تسلسل إلى تسلسل. بعد ذلك، نقترح مهمة تركيبية مساعدة للتصنيف من أسفل إلى أعلى. ثم، من القواميس الخارجية، نسترجع التعريفات النصية لفئات جميع طبقات التسلسل الهرمي، ونضعها في فضاء متجه الكلمة. نستخدم تضمينات تعريف الفئة كمدخل إضافي لحالة التنبؤ بالطبقة التالية وفي بحث شعاعي معدّل. في حين أن البحث المعدل لم يوفر مكاسب كبيرة، فإن الجمع بين المهمة الإضافية والمدخل الإضافي للتعريفات الصفية يعزز بشكل كبير دقة التصنيف. مع مناهجنا الفعالة، نقوم بإجراء دراسات سابقة، باستخدام معلمات مخفضة بشكل كبير في عددين معروفين جيدًا باللغة الإنجليزية.

Translated Description (French)

Dans la classification de texte hiérarchique, nous effectuons une séquence d'étapes d'inférence pour prédire la catégorie d'un document de haut en bas d'une taxonomie de classe donnée. La plupart des études se sont concentrées sur le développement de nouvelles architectures de réseau neuronal pour traiter la structure hiérarchique, mais nous préférons chercher des moyens efficaces de renforcer un modèle de base. Nous définissons d'abord la tâche comme un problème de séquence à séquence. Ensuite, nous proposons une tâche synthétique auxiliaire de classification ascendante. Ensuite, à partir de dictionnaires externes, nous récupérons les définitions textuelles pour les classes de toutes les couches de la hiérarchie et les mappons dans l'espace vectoriel des mots. Nous utilisons les intégrations de définition de classe comme une entrée supplémentaire pour conditionner la prédiction de la couche suivante et dans une recherche par faisceau adaptée. Étant donné que la recherche modifiée n'a pas fourni de gains importants, la combinaison de la tâche auxiliaire et de l'entrée supplémentaire des définitions de classe améliore considérablement la précision de la classification. Avec nos approches efficaces, nous surpassons les études précédentes, en utilisant un nombre considérablement réduit de paramètres, dans deux ensembles de données anglais bien connus.

Translated Description (Spanish)

En la clasificación jerárquica de textos, realizamos una secuencia de pasos de inferencia para predecir la categoría de un documento de arriba a abajo de una taxonomía de clase dada. La mayoría de los estudios se han centrado en desarrollar arquitecturas de redes neuronales novedosas para tratar con la estructura jerárquica, pero preferimos buscar formas eficientes de fortalecer un modelo de línea de base. Primero definimos la tarea como un problema de secuencia a secuencia. Después, proponemos una tarea sintética auxiliar de clasificación ascendente. Luego, a partir de diccionarios externos, recuperamos definiciones textuales para las clases de todas las capas de la jerarquía y las asignamos al espacio vectorial de palabras. Utilizamos las incrustaciones de definición de clase como una entrada adicional para condicionar la predicción de la siguiente capa y en una búsqueda de haz adaptada. Como la búsqueda modificada no proporcionó grandes ganancias, la combinación de la tarea auxiliar y la entrada adicional de las definiciones de clase mejoran significativamente la precisión de la clasificación. Con nuestros enfoques eficientes, superamos estudios previos, utilizando un número drásticamente reducido de parámetros, en dos conjuntos de datos ingleses bien conocidos.

Files

2020.acl-main.205.pdf.pdf

Files (226 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:5360980bad11bf9723da89687501effc
226 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
استراتيجيات فعالة لتصنيف النص الهرمي: المعرفة الخارجية والمهام المساعدة
Translated title (French)
Stratégies efficaces pour la classification hiérarchique des textes : connaissances externes et tâches auxiliaires
Translated title (Spanish)
Estrategias eficientes para la clasificación jerárquica de textos: conocimiento externo y tareas auxiliares

Identifiers

Other
https://openalex.org/W3034880265
DOI
10.18653/v1/2020.acl-main.205

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Brazil

References

  • https://openalex.org/W2025047573
  • https://openalex.org/W2135813353
  • https://openalex.org/W2150766729
  • https://openalex.org/W2597891111
  • https://openalex.org/W2759474451
  • https://openalex.org/W2788667846
  • https://openalex.org/W2891369851
  • https://openalex.org/W2914602134
  • https://openalex.org/W2949778647
  • https://openalex.org/W2952230191
  • https://openalex.org/W2952641483
  • https://openalex.org/W2953183526
  • https://openalex.org/W2963631426
  • https://openalex.org/W2963691697
  • https://openalex.org/W2964199361
  • https://openalex.org/W2970390610
  • https://openalex.org/W3102516861