Published January 1, 2023 | Version v1
Publication Open

FAA: Fine-grained Attention Alignment for Cascade Document Ranking

  • 1. Peking University
  • 2. Microsoft (Finland)
  • 3. University of Technology Sydney
  • 4. Convergence

Description

Document ranking aims at sorting a collection of documents with their relevance to a query.Contemporary methods explore more efficient transformers or divide long documents into passages to handle the long input.However, intensive query-irrelevant content may lead to harmful distraction and high query latency.Some recent works further propose cascade document ranking models that extract relevant passages with an efficient selector before ranking, however, their selection and ranking modules are almost independently optimized and deployed, leading to selecting error reinforcement and sub-optimal performance.In fact, the document ranker can provide fine-grained supervision to make the selector more generalizable and compatible, and the selector built upon a different structure can offer a distinct perspective to assist in document ranking.Inspired by this, we propose a fine-grained attention alignment approach to jointly optimize a cascade document ranking model.Specifically, we utilize the attention activations over the passages from the ranker as fine-grained attention feedback to optimize the selector.Meanwhile, we fuse the relevance scores from the passage selector into the ranker to assist in calculating the cooperative matching representation.Experiments on MS MARCO and TREC DL demonstrate the effectiveness of our method.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يهدف تصنيف المستندات إلى فرز مجموعة من المستندات ذات الصلة بالاستعلام. تستكشف الطرق المعاصرة محولات أكثر كفاءة أو تقسم المستندات الطويلة إلى مقاطع للتعامل مع المدخلات الطويلة. ومع ذلك، قد يؤدي محتوى الاستعلام المكثف غير ذي الصلة إلى إلهاء ضار ووقت استجابة استعلام عالي. تقترح بعض الأعمال الحديثة أيضًا نماذج ترتيب المستندات المتتالية التي تستخرج المقاطع ذات الصلة باستخدام محدد فعال قبل الترتيب، ومع ذلك، يتم تحسين ونشر وحدات الاختيار والترتيب الخاصة بها بشكل مستقل تقريبًا، مما يؤدي إلى اختيار تعزيز الخطأ والأداء دون المستوى الأمثل. في الواقع، يمكن أن يوفر مصفف المستندات إشرافًا دقيقًا لجعل المحدد أكثر قابلية للتعميم ومتوافقًا، ويمكن أن يقدم المحدد المبني على هيكل مختلف منظورًا متميزًا للمساعدة في ترتيب المستندات. مستوحى من ذلك، نقترح نهجًا دقيقًا لمواءمة الانتباه لتحسين نموذج ترتيب المستندات المتتالية بشكل مشترك. على وجه التحديد، نستخدم تنشيط الانتباه على المقاطع من المصفف كملاحظات انتباه دقيقة لتحسين المحدد. وفي الوقت نفسه، ندمج درجات الصلة من محدد المقطع في المصفف للمساعدة في حساب تمثيل المطابقة التعاونية .التجارب على MS MARCO و TREC DL تثبت فعالية طريقتنا.

Translated Description (French)

Le classement des documents vise à trier une collection de documents en fonction de leur pertinence pour une requête. Les méthodes contemporaines explorent des transformateurs plus efficaces ou divisent de longs documents en passages pour gérer l'entrée longue. Cependant, un contenu non pertinent pour une requête intensive peut entraîner une distraction préjudiciable et une latence de requête élevée. Certains travaux récents proposent en outre des modèles de classement de documents en cascade qui extraient les passages pertinents avec un sélecteur efficace avant le classement, cependant, leurs modules de sélection et de classement sont optimisés et déployés de manière presque indépendante, ce qui permet de sélectionner le renforcement des erreurs et les performances sous-optimales. En fait, le classeur de documents peut fournir une supervision fine pour rendre le sélecteur plus généralisable et compatible, et le sélecteur construit sur une structure différente peut offrir une perspective distincte pour aider au classement des documents. Inspirés par cela, nous proposons une approche d'alignement d'attention fine pour optimiser conjointement un modèle de classement de documents en cascade. Spécifiquement, nous utilisons les activations d'attention sur les passages du classeur comme rétroaction d'attention fine pour optimiser le sélecteur. En attendant, nous fusionnons les scores de pertinence du sélecteur de passage dans le classeur pour aider à calculer la représentation de correspondance coopérative. Expériences sur MS MARCO et TREC DL démontrent l'efficacité de notre méthode.

Translated Description (Spanish)

La clasificación de documentos tiene como objetivo ordenar una colección de documentos con su relevancia para una consulta. Los métodos contemporáneos exploran transformadores más eficientes o dividen documentos largos en pasajes para manejar la entrada larga. Sin embargo, el contenido intensivo irrelevante para la consulta puede conducir a una distracción dañina y una alta latencia de consulta. Algunos trabajos recientes proponen además modelos de clasificación de documentos en cascada que extraen pasajes relevantes con un selector eficiente antes de la clasificación, sin embargo, sus módulos de selección y clasificación se optimizan e implementan de forma casi independiente, lo que lleva a seleccionar el refuerzo de errores y el rendimiento subóptimo. De hecho, el clasificador de documentos puede proporcionar una supervisión detallada para hacer que el selector sea más generalizable y compatible, y el selector construido sobre una estructura diferente puede ofrecer una perspectiva distinta para ayudar en la clasificación de documentos. Inspirados por esto, proponemos un enfoque de alineación de atención detallada para optimizar conjuntamente un modelo de clasificación de documentos en cascada. Específicamente, utilizamos las activaciones de atención sobre los pasajes del clasificador como retroalimentación de atención detallada para optimizar el selector. Mientras tanto, fusionamos las puntuaciones de relevancia del selector de pasajes en el clasificador para ayudar a calcular la representación de coincidencia cooperativa. Experimentos en MS MARCO y TREC DL demuestran la efectividad de nuestro método.

Files

2023.acl-long.94.pdf.pdf

Files (365.2 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:192d1b0a7de4d35d85dab339fd320637
365.2 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
إدارة الطيران الفيدرالية: محاذاة الانتباه الدقيق لترتيب المستندات التعاقبية
Translated title (French)
FAA : Alignement de l'attention à grain fin pour le classement des documents en cascade
Translated title (Spanish)
FAA: Alineación de atención de grano fino para la clasificación de documentos en cascada

Identifiers

Other
https://openalex.org/W4385565292
DOI
10.18653/v1/2023.acl-long.94

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W2157331557
  • https://openalex.org/W2963341956
  • https://openalex.org/W2964012472
  • https://openalex.org/W3034999214
  • https://openalex.org/W3104220682
  • https://openalex.org/W4293004632