Published January 1, 2023 | Version v1
Publication Open

Improving Radiology Summarization with Radiograph and Anatomy Prompts

  • 1. Chinese University of Hong Kong, Shenzhen
  • 2. Shenzhen Research Institute of Big Data
  • 3. Guangzhou Experimental Station

Description

The impression is crucial for the referring physicians to grasp key information since it is concluded from the findings and reasoning of radiologists.To alleviate the workload of radiologists and reduce repetitive human labor in impression writing, many researchers have focused on automatic impression generation.However, recent works on this task mainly summarize the corresponding findings and pay less attention to the radiology images.In clinical, radiographs can provide more detailed valuable observations to enhance radiologists' impression writing, especially for complicated cases.Besides, each sentence in findings usually focuses on single anatomy, such that they only need to be matched to corresponding anatomical regions instead of the whole image, which is beneficial for textual and visual features alignment.Therefore, we propose a novel anatomyenhanced multimodal model to improve impression generation.In detail, we first construct a set of rules to extract anatomies and put these prompts into each sentence to highlight anatomy characteristics.Then, two separate encoders are applied to extract features from the radiograph and findings.Afterward, we apply a contrastive learning module to align these two representations at the overall level and use a co-attention to fuse them at the sentence level with the help of anatomy-enhanced sentence representation.The experimental results on two benchmark datasets confirm the effectiveness of the proposed method, which achieves state-of-the-art results.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يعد الانطباع أمرًا بالغ الأهمية بالنسبة لأطباء الإحالة لفهم المعلومات الأساسية لأنه يتم استنتاجه من نتائج واستدلال أخصائيي الأشعة. للتخفيف من عبء عمل أخصائيي الأشعة وتقليل العمل البشري المتكرر في كتابة الانطباع، ركز العديد من الباحثين على توليد الانطباع التلقائي. ومع ذلك، فإن الأعمال الأخيرة في هذه المهمة تلخص بشكل أساسي النتائج المقابلة وتولي اهتمامًا أقل لصور الأشعة. في التصوير السريري، يمكن أن توفر الصور الشعاعية ملاحظات قيمة أكثر تفصيلاً لتعزيز كتابة انطباع أخصائيي الأشعة، خاصة في الحالات المعقدة. إلى جانب ذلك، فإن كل جملة في النتائج عادة ما يركز على التشريح الفردي، بحيث لا تحتاج إلا إلى مطابقتها مع المناطق التشريحية المقابلة بدلاً من الصورة بأكملها، وهو أمر مفيد لمحاذاة الميزات النصية والبصرية. لذلك، نقترح نموذجًا جديدًا متعدد الوسائط معززًا بالتشريح لتحسين توليد الانطباع. بالتفصيل، نقوم أولاً ببناء مجموعة من القواعد لاستخراج التشريح ووضع هذه المطالبات في كل جملة لتسليط الضوء على خصائص التشريح. ثم، يتم تطبيق مشفرين منفصلين لاستخراج الميزات من الصورة الشعاعية والنتائج. بعد ذلك، نطبق وحدة تعلم متباينة لمواءمة هذين التمثيلين على المستوى العام واستخدام الانتباه المشترك لدمجها على مستوى الجملة بمساعدة تمثيل الجملة المعزز بالتشريح. تؤكد النتائج التجريبية على مجموعتي بيانات معياريتين فعالية الطريقة المقترحة، والتي تحقق أحدث النتائج.

Translated Description (French)

Pour alléger la charge de travail des radiologues et réduire le travail humain répétitif dans la rédaction d'impressions, de nombreux chercheurs se sont concentrés sur la génération automatique d'impressions. Cependant, les travaux récents sur cette tâche résument principalement les résultats correspondants et accordent moins d'attention aux images radiologiques. En clinique, les radiographies peuvent fournir des observations précieuses plus détaillées pour améliorer la rédaction d'impressions par les radiologues, en particulier pour les cas compliqués. En outre, chaque phrase dans les résultats se concentre généralement sur une seule anatomie, de sorte qu'il suffit de les faire correspondre aux régions anatomiques correspondantes au lieu de l'image entière, ce qui est bénéfique pour l'alignement des caractéristiques textuelles et visuelles.Par conséquent, nous proposons un nouveau modèle multimodal amélioré par l'anatomie pour améliorer la génération d'impressions.Dans le détail, nous construisons d'abord un ensemble de règles pour extraire les anatomies et mettons ces invites dans chaque phrase pour mettre en évidence les caractéristiques de l'anatomie.Puis, deux codeurs distincts sont appliqués pour extraire les caractéristiques de la radiographie et des résultats.Après, nous appliquons un module d'apprentissage contrastif pour aligner ces deux représentations au niveau global et utiliser une co-attention pour les fusionner au niveau de la phrase à l'aide d'une représentation de phrase améliorée par l'anatomie. Les résultats expérimentaux sur deux ensembles de données de référence confirment l'efficacité de la méthode proposée, qui atteint des résultats de pointe.

Translated Description (Spanish)

La impresión es crucial para que los médicos remitentes capten información clave, ya que se concluye a partir de los hallazgos y el razonamiento de los radiólogos. Para aliviar la carga de trabajo de los radiólogos y reducir el trabajo humano repetitivo en la escritura de impresiones, muchos investigadores se han centrado en la generación automática de impresiones. Sin embargo, los trabajos recientes sobre esta tarea resumen principalmente los hallazgos correspondientes y prestan menos atención a las imágenes radiológicas. En clínica, las radiografías pueden proporcionar observaciones valiosas más detalladas para mejorar la escritura de impresiones de los radiólogos, especialmente para casos complicados. Además, cada oración en los hallazgos generalmente se enfoca en una sola anatomía, de modo que solo deben coincidir con las regiones anatómicas correspondientes en lugar de con la imagen completa, lo que es beneficioso para la alineación de características textuales y visuales. Por lo tanto, proponemos un nuevo modelo multimodal mejorado en anatomía para mejorar la generación de impresiones. En detalle, primero construimos un conjunto de reglas para extraer anatomías y ponemos estas indicaciones en cada oración para resaltar las características de la anatomía. Luego, se aplican dos codificadores separados para extraer características de la radiografía y los hallazgos. Después, aplicamos un módulo de aprendizaje contrastante para alinear estas dos representaciones a nivel general y usar una atención conjunta para fusionarlos a nivel de oración con la ayuda de la representación de oraciones mejorada por la anatomía. Los resultados experimentales en dos conjuntos de datos de referencia confirman la efectividad del método propuesto, que logra resultados de vanguardia.

Files

2023.findings-acl.764.pdf.pdf

Files (1.1 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:70e879f7765a987444051d9acd3ab4d5
1.1 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
تحسين تلخيص الأشعة مع مطالبات التصوير الشعاعي والتشريح
Translated title (French)
Amélioration de la synthèse radiologique avec des invites de radiographie et d'anatomie
Translated title (Spanish)
Mejora de la resumen de radiología con indicaciones de radiografía y anatomía

Identifiers

Other
https://openalex.org/W4385570150
DOI
10.18653/v1/2023.findings-acl.764

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China