Published January 1, 2024 | Version v1
Publication Open

Saliency-Aware Deep Learning Approach for Enhanced Endoscopic Image Super-Resolution

  • 1. Chulalongkorn University

Description

The adoption of Stereo Imaging technology within endoscopic procedures represents a transformative advancement in medical imaging, providing surgeons with depth perception and detailed views of internal anatomy for enhanced diagnostic accuracy and surgical precision. However, the practical application of stereo imaging in endoscopy faces challenges, including the generation of low-resolution and blurred images, which can hinder the effectiveness of medical diagnoses and interventions. Our research introduces an endoscopic image SR model in response to these specific. This model features an innovative feature extraction module and an advanced cross-view feature interaction module tailored for the intricacies of endoscopic imagery. Initially trained on the SCARED dataset, our model was rigorously tested across four additional publicly available endoscopic image datasets at scales 2, 4, and 8, demonstrating unparalleled performance improvements in endoscopic SR. Our results are compelling. They show that our model not only substantially enhances the quality of endoscopic images but also consistently surpasses other existing methods like E-SEVSR [6], DCCSRNet [10], and CCSBESR [5] in all tested datasets, in quantitative measures such as PSNR and SSIM, and in qualitative evaluations. The successful application of our SR model in endoscopic imaging has the potential to revolutionize medical diagnostics and surgery, significantly increasing the precision and effectiveness of endoscopic procedures. The code will be released on GitHub and can be accessed at https://github.com/cu-vtrg-lab/Saliency-Aware-Deep-Learning-Approach-for-Enhanced-Endoscopic-Image-SR.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يمثل اعتماد تقنية التصوير المجسم في إجراءات التنظير تقدمًا تحويليًا في التصوير الطبي، مما يوفر للجراحين إدراكًا عميقًا ومناظر مفصلة للتشريح الداخلي لتعزيز دقة التشخيص والدقة الجراحية. ومع ذلك، فإن التطبيق العملي للتصوير الاستريو في التنظير الداخلي يواجه تحديات، بما في ذلك توليد صور منخفضة الدقة وغير واضحة، والتي يمكن أن تعيق فعالية التشخيصات والتدخلات الطبية. يقدم بحثنا نموذج SR للصورة بالمنظار استجابة لهذه المحددات. يتميز هذا النموذج بوحدة استخلاص الميزات المبتكرة ووحدة تفاعل ميزات العرض المتقاطع المتقدمة المصممة خصيصًا لتعقيدات الصور بالمنظار. تم تدريب نموذجنا في البداية على مجموعة البيانات الخائفة، وتم اختباره بدقة عبر أربع مجموعات بيانات إضافية متاحة للجمهور على المقاييس 2 و 4 و 8، مما يدل على تحسينات أداء لا مثيل لها في التنظير. نتائجنا مقنعة. وهي تظهر أن نموذجنا لا يعزز بشكل كبير جودة الصور بالمنظار فحسب، بل يتجاوز أيضًا باستمرار الطرق الحالية الأخرى مثل E - SEVSR [6] و DCCSRNet [10] و CCSBESR [5] في جميع مجموعات البيانات التي تم اختبارها، وفي المقاييس الكمية مثل PSNR و SSIM، وفي التقييمات النوعية. إن التطبيق الناجح لنموذج SR الخاص بنا في التصوير بالمنظار لديه القدرة على إحداث ثورة في التشخيص الطبي والجراحة، مما يزيد بشكل كبير من دقة وفعالية إجراءات التنظير الداخلي. سيتم إصدار الرمز على GitHub ويمكن الوصول إليه على https://github.com/cu-vtrg-lab/Saliency-Aware-Deep-Learning-Approach-for-Enhanced-Endoscopic-Image-SR.

Translated Description (French)

L'adoption de la technologie d'imagerie stéréo dans les procédures endoscopiques représente une avancée transformatrice dans l'imagerie médicale, offrant aux chirurgiens une perception de la profondeur et des vues détaillées de l'anatomie interne pour une précision diagnostique et une précision chirurgicale améliorées. Cependant, l'application pratique de l'imagerie stéréoscopique en endoscopie est confrontée à des défis, notamment la génération d'images floues et à faible résolution, qui peuvent entraver l'efficacité des diagnostics et des interventions médicales. Notre recherche introduit un modèle de SR d'image endoscopique en réponse à ces spécificités. Ce modèle comprend un module d'extraction de caractéristiques innovant et un module d'interaction de caractéristiques à vue transversale avancé adapté aux subtilités de l'imagerie endoscopique. Initialement formé sur l'ensemble de données Fear, notre modèle a été rigoureusement testé sur quatre autres ensembles de données d'images endoscopiques accessibles au public aux échelles 2, 4 et 8, démontrant des améliorations de performances inégalées en matière de SR endoscopique. Nos résultats sont convaincants. Ils montrent que notre modèle améliore non seulement considérablement la qualité des images endoscopiques, mais dépasse également systématiquement d'autres méthodes existantes comme E-SEVSR [6], DCCSRNet [10] et CCSBESR [5] dans tous les ensembles de données testés, dans les mesures quantitatives telles que PSNR et SSIM, et dans les évaluations qualitatives. L'application réussie de notre modèle SR en imagerie endoscopique a le potentiel de révolutionner le diagnostic médical et la chirurgie, augmentant considérablement la précision et l'efficacité des procédures endoscopiques. Le code sera publié sur GitHub et peut être consulté à l'adresse https://github.com/cu-vtrg-lab/Saliency-Aware-Deep-Learning-Approach-for-Enhanced-Endoscopic-Image-SR.

Translated Description (Spanish)

La adopción de la tecnología de imágenes estéreo en los procedimientos endoscópicos representa un avance transformador en las imágenes médicas, ya que proporciona a los cirujanos una percepción profunda y vistas detalladas de la anatomía interna para mejorar la precisión diagnóstica y quirúrgica. Sin embargo, la aplicación práctica de las imágenes estéreo en la endoscopia enfrenta desafíos, incluida la generación de imágenes de baja resolución y borrosas, lo que puede dificultar la efectividad de los diagnósticos e intervenciones médicas. Nuestra investigación introduce un modelo de SR de imagen endoscópica en respuesta a estos específicos. Este modelo cuenta con un innovador módulo de extracción de características y un módulo avanzado de interacción de características de vista cruzada adaptado a las complejidades de las imágenes endoscópicas. Inicialmente entrenado en el conjunto de datos SCARED, nuestro modelo se probó rigurosamente en cuatro conjuntos de datos de imágenes endoscópicas adicionales disponibles públicamente en las escalas 2, 4 y 8, lo que demuestra mejoras de rendimiento sin precedentes en la SR endoscópica. Nuestros resultados son convincentes. Muestran que nuestro modelo no solo mejora sustancialmente la calidad de las imágenes endoscópicas, sino que también supera constantemente a otros métodos existentes como E-SEVSR [6], DCCSRNet [10] y CCSBESR [5] en todos los conjuntos de datos probados, en medidas cuantitativas como PSNR y SSIM, y en evaluaciones cualitativas. La aplicación exitosa de nuestro modelo SR en imágenes endoscópicas tiene el potencial de revolucionar el diagnóstico médico y la cirugía, aumentando significativamente la precisión y efectividad de los procedimientos endoscópicos. El código se publicará en GitHub y se puede acceder a él en https://github.com/cu-vtrg-lab/Saliency-Aware-Deep-Learning-Approach-for-Enhanced-Endoscopic-Image-SR.

Files

10534254.pdf.pdf

Files (245 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:3fa0a766bc2e4d5ae56dd05f04b2fd39
245 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
نهج التعلم العميق الواعي بالصلاحية لتحسين الصورة بالمنظار فائق الدقة
Translated title (French)
Approche d'apprentissage en profondeur consciente de la saillance pour une super-résolution améliorée de l'image endoscopique
Translated title (Spanish)
Enfoque de aprendizaje profundo consciente de la prominencia para una superresolución de imágenes endoscópicas mejorada

Identifiers

Other
https://openalex.org/W4398150979
DOI
10.1109/access.2024.3402953

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Thailand