Medical decision support system using weakly-labeled lung CT scans
Creators
- Alejandro Murillo-González1
 - 
    
      David González2
  
  
      
      
        
 - 
    
      Laura Jaramillo2
  
  
      
      
        
 - Carlos Galeano2
 - Fabby Tavera3
 - Marcia Mejía3
 - 
    
      Alejandro Hernández
  
  
      
      
        
 - David R. Rivera1
 - J. G. Paniagua4
 - Leandro Ariza-Jiménez1
 - José Julián Garcés Echeverri1
 - Christian Andrés Díaz León1
 - Diana Lucia Serna-Higuita1
 - Wayner Barrios
 - Wiston Arrázola1
 - Miguel Ángel Mejía1
 - Sebastián Arango1
 - Daniela Marín Ramírez1
 - 
    
      Emmanuel Salinas‐Miranda
  
  
      
      
        
 - O. L. Quintero1
 
- 1. Universidad EAFIT
 - 2. Clínica CES
 - 3. Universidad de Antioquia
 - 4. Instituto Tecnológico Metropolitano
 
Description
Determination and development of an effective set of models leveraging Artificial Intelligence techniques to generate a system able to support clinical practitioners working with COVID-19 patients. It involves a pipeline including classification, lung and lesion segmentation, as well as lesion quantification of axial lung CT studies.A deep neural network architecture based on DenseNet is introduced for the classification of weakly-labeled, variable-sized (and possibly sparse) axial lung CT scans. The models are trained and tested on aggregated, publicly available data sets with over 10 categories. To further assess the models, a data set was collected from multiple medical institutions in Colombia, which includes healthy, COVID-19 and patients with other diseases. It is composed of 1,322 CT studies from a diverse set of CT machines and institutions that make over 550,000 slices. Each CT study was labeled based on a clinical test, and no per-slice annotation took place. This enabled a classification into Normal vs. Abnormal patients, and for those that were considered abnormal, an extra classification step into Abnormal (other diseases) vs. COVID-19. Additionally, the pipeline features a methodology to segment and quantify lesions of COVID-19 patients on the complete CT study, enabling easier localization and progress tracking. Moreover, multiple ablation studies were performed to appropriately assess the elements composing the classification pipeline.The best performing lung CT study classification models achieved 0.83 accuracy, 0.79 sensitivity, 0.87 specificity, 0.82 F1 score and 0.85 precision for the Normal vs. Abnormal task. For the Abnormal vs COVID-19 task, the model obtained 0.86 accuracy, 0.81 sensitivity, 0.91 specificity, 0.84 F1 score and 0.88 precision. The ablation studies showed that using the complete CT study in the pipeline resulted in greater classification performance, restating that relevant COVID-19 patterns cannot be ignored towards the top and bottom of the lung volume.The lung CT classification architecture introduced has shown that it can handle weakly-labeled, variable-sized and possibly sparse axial lung studies, reducing the need for expert annotations at a per-slice level.This work presents a working methodology that can guide the development of decision support systems for clinical reasoning in future interventionist or prospective studies.
Translated Descriptions
Translated Description (Arabic)
تحديد وتطوير مجموعة فعالة من النماذج التي تستفيد من تقنيات الذكاء الاصطناعي لتوليد نظام قادر على دعم الممارسين السريريين الذين يعملون مع مرضى كوفيد-19. يتضمن خط أنابيب بما في ذلك التصنيف وتقسيم الرئة والآفة، بالإضافة إلى تحديد كمية الآفة لدراسات التصوير المقطعي المحوري للرئة. يتم تقديم بنية الشبكة العصبية العميقة بناءً على DenseNet لتصنيف فحوصات التصوير المقطعي المحوري للرئة ذات العلامات الضعيفة والمتغيرة الحجم (وربما المتناثرة). يتم تدريب النماذج واختبارها على مجموعات بيانات مجمعة ومتاحة للجمهور تضم أكثر من 10 فئات. لمزيد من تقييم النماذج، تم جمع مجموعة بيانات من مؤسسات طبية متعددة في كولومبيا، والتي تشمل الأصحاء و COVID -19 والمرضى الذين يعانون من أمراض أخرى. وهو يتألف من 1322 دراسة للتصوير المقطعي المحوسب من مجموعة متنوعة من آلات التصوير المقطعي المحوسب والمؤسسات التي تصنع أكثر من 550،000 شريحة. تم تصنيف كل دراسة للتصوير المقطعي المحوسب بناءً على اختبار سريري، ولم يتم إجراء أي تعليق توضيحي لكل شريحة. وقد مكن هذا من التصنيف إلى مرضى طبيعيين مقابل مرضى غير طبيعيين، وبالنسبة لأولئك الذين اعتبروا غير طبيعيين، خطوة تصنيف إضافية إلى مرضى غير طبيعيين (أمراض أخرى) مقابل COVID -19. بالإضافة إلى ذلك، يتميز خط الأنابيب بمنهجية لتقسيم وقياس آفات مرضى كوفيد-19 في دراسة التصوير المقطعي المحوسب الكاملة، مما يتيح سهولة التوطين وتتبع التقدم. علاوة على ذلك، تم إجراء دراسات استئصال متعددة لتقييم العناصر المكونة لخط أنابيب التصنيف بشكل مناسب. حققت نماذج تصنيف دراسة التصوير المقطعي المحوسب الأفضل أداءً 0.83 دقة و 0.79 حساسية و 0.87 خصوصية و 0.82 درجة F1 و 0.85 دقة للمهمة العادية مقابل غير الطبيعية. بالنسبة للمهمة غير الطبيعية مقابل COVID -19، حصل النموذج على 0.86 دقة و 0.81 حساسية و 0.91 خصوصية و 0.84 درجة F1 و 0.88 دقة. أظهرت دراسات الاستئصال أن استخدام دراسة التصوير المقطعي المحوسب الكاملة في خط الأنابيب أدى إلى أداء تصنيف أكبر، مع إعادة التأكيد على أنه لا يمكن تجاهل أنماط COVID -19 ذات الصلة نحو الجزء العلوي والسفلي من حجم الرئة. أظهرت بنية تصنيف التصوير المقطعي المحوسب للرئة المقدمة أنه يمكنها التعامل مع دراسات الرئة المحورية ذات العلامات الضعيفة والمتغيرة الحجم وربما المتفرقة، مما يقلل من الحاجة إلى تعليقات توضيحية متخصصة على مستوى كل شريحة. يقدم هذا العمل منهجية عمل يمكن أن توجه تطوير أنظمة دعم القرار للتفكير السريري في الدراسات التدخلية أو المستقبلية.Translated Description (French)
Détermination et développement d'un ensemble efficace de modèles tirant parti des techniques d'intelligence artificielle pour générer un système capable de soutenir les praticiens cliniques travaillant avec des patients atteints de COVID-19. Il implique un pipeline comprenant la classification, la segmentation des poumons et des lésions, ainsi que la quantification des lésions des études de tomodensitométrie pulmonaire axiale. Une architecture de réseau neuronal profond basée sur DenseNet est introduite pour la classification des tomodensitogrammes pulmonaires axiaux faiblement marqués, de taille variable (et éventuellement clairsemés). Les modèles sont formés et testés sur des ensembles de données agrégés et accessibles au public avec plus de 10 catégories. Pour évaluer davantage les modèles, un ensemble de données a été collecté auprès de plusieurs institutions médicales en Colombie, qui comprend des patients en bonne santé, atteints de COVID-19 et d'autres maladies. Il est composé de 1 322 études de tomodensitométrie provenant d'un ensemble diversifié de machines et d'institutions de tomodensitométrie qui produisent plus de 550 000 tranches. Chaque étude de tomodensitométrie a été étiquetée sur la base d'un test clinique, et aucune annotation par tranche n'a eu lieu. Cela a permis une classification en patients normaux vs anormaux, et pour ceux qui ont été considérés comme anormaux, une étape de classification supplémentaire en anormaux (autres maladies) vs COVID-19. En outre, le pipeline comprend une méthodologie permettant de segmenter et de quantifier les lésions des patients atteints de COVID-19 sur l'étude complète de tomodensitométrie, ce qui facilite la localisation et le suivi des progrès. De plus, de multiples études d'ablation ont été réalisées pour évaluer de manière appropriée les éléments composant le pipeline de classification. Les modèles de classification des études de tomodensitométrie pulmonaire les plus performants ont atteint une précision de 0,83, une sensibilité de 0,79, une spécificité de 0,87, un score de 0,82 F1 et une précision de 0,85 pour la tâche normale par rapport à la tâche anormale. Pour la tâche Anormale vs COVID-19, le modèle a obtenu une précision de 0,86, une sensibilité de 0,81, une spécificité de 0,91, un score de 0,84 F1 et une précision de 0,88. Les études d'ablation ont montré que l'utilisation de l'étude complète de tomodensitométrie dans le pipeline a entraîné une plus grande performance de classification, réaffirmant que les modèles de COVID-19 pertinents ne peuvent pas être ignorés vers le haut et le bas du volume pulmonaire. L'architecture de classification de tomodensitométrie pulmonaire introduite a montré qu'elle peut gérer des études pulmonaires axiales faiblement étiquetées, de taille variable et éventuellement clairsemées, réduisant le besoin d'annotations d'experts au niveau par tranche. Ce travail présente une méthodologie de travail qui peut guider le développement de systèmes d'aide à la décision pour le raisonnement clinique dans de futures études interventionnistes ou prospectives.Translated Description (Spanish)
Determinación y desarrollo de un conjunto efectivo de modelos que aprovechan las técnicas de Inteligencia Artificial para generar un sistema capaz de apoyar a los profesionales clínicos que trabajan con pacientes con COVID-19. Implica una canalización que incluye clasificación, segmentación pulmonar y de lesiones, así como cuantificación de lesiones de estudios de TC de pulmón axial. Se introduce una arquitectura de red neuronal profunda basada en DenseNet para la clasificación de tomografías axial de pulmón débilmente etiquetadas, de tamaño variable (y posiblemente escasas). Los modelos se entrenan y prueban en conjuntos de datos agregados y disponibles públicamente con más de 10 categorías. Para evaluar aún más los modelos, se recopiló un conjunto de datos de múltiples instituciones médicas en Colombia, que incluye pacientes sanos, COVID-19 y pacientes con otras enfermedades. Se compone de 1.322 estudios de TC de un conjunto diverso de máquinas e instituciones de TC que producen más de 550.000 cortes. Cada estudio de TC se etiquetó en función de una prueba clínica y no se realizó ninguna anotación por corte. Esto permitió una clasificación en pacientes normales frente a anormales, y para aquellos que se consideraron anormales, un paso adicional de clasificación en anormal (otras enfermedades) frente a COVID-19. Además, la cartera cuenta con una metodología para segmentar y cuantificar las lesiones de los pacientes con COVID-19 en el estudio completo de TC, lo que permite una localización y seguimiento del progreso más fáciles. Además, se realizaron múltiples estudios de ablación para evaluar adecuadamente los elementos que componen la canalización de clasificación. Los modelos de clasificación del estudio de TC de pulmón de mejor rendimiento lograron 0,83 de precisión, 0,79 de sensibilidad, 0,87 de especificidad, 0,82 de puntuación F1 y 0,85 de precisión para la tarea Normal frente a Anormal. Para la tarea Anormal vs COVID-19, el modelo obtuvo 0,86 de precisión, 0,81 de sensibilidad, 0,91 de especificidad, 0,84 de puntuación F1 y 0,88 de precisión. Los estudios de ablación mostraron que el uso del estudio completo de TC en la tubería resultó en un mayor rendimiento de clasificación, reafirmando que los patrones relevantes de COVID-19 no pueden ignorarse hacia la parte superior e inferior del volumen pulmonar. La arquitectura de clasificación de TC pulmonar introducida ha demostrado que puede manejar estudios pulmonares axiales débilmente etiquetados, de tamaño variable y posiblemente escasos, reduciendo la necesidad de anotaciones de expertos a nivel por corte. Este trabajo presenta una metodología de trabajo que puede guiar el desarrollo de sistemas de apoyo a la toma de decisiones para el razonamiento clínico en futuros estudios intervencionistas o prospectivos.Files
      
        pdf.pdf
        
      
    
    
      
        Files
         (2.7 MB)
        
      
    
    | Name | Size | Download all | 
|---|---|---|
| 
          
          md5:e1ef78a376c44e7a542315b303f8dbce
           | 
        
        2.7 MB | Preview Download | 
Additional details
Additional titles
- Translated title (Arabic)
 - نظام دعم القرار الطبي باستخدام فحوصات التصوير المقطعي المحوسب للرئة ذات العلامات الضعيفة
 - Translated title (French)
 - Système d'aide à la décision médicale utilisant des tomodensitogrammes pulmonaires faiblement étiquetés
 - Translated title (Spanish)
 - Sistema de apoyo a la toma de decisiones médicas que utiliza tomografías computarizadas de pulmón débilmente etiquetadas
 
Identifiers
- Other
 - https://openalex.org/W4297542302
 - DOI
 - 10.3389/fmedt.2022.980735
 
            
              References
            
          
        - https://openalex.org/W2124756338
 - https://openalex.org/W2135003422
 - https://openalex.org/W2155662634
 - https://openalex.org/W2901954625
 - https://openalex.org/W2914835499
 - https://openalex.org/W2957352479
 - https://openalex.org/W3012211282
 - https://openalex.org/W3013732976
 - https://openalex.org/W3017403618
 - https://openalex.org/W3017451406
 - https://openalex.org/W3020653337
 - https://openalex.org/W3025391403
 - https://openalex.org/W3027763298
 - https://openalex.org/W3035986928
 - https://openalex.org/W3037538421
 - https://openalex.org/W3038744550
 - https://openalex.org/W3047489308
 - https://openalex.org/W3091940685
 - https://openalex.org/W3097517628
 - https://openalex.org/W3099561884
 - https://openalex.org/W3100327638
 - https://openalex.org/W3110116576
 - https://openalex.org/W3117287302
 - https://openalex.org/W3128998772
 - https://openalex.org/W3133191822
 - https://openalex.org/W3133631487
 - https://openalex.org/W3139833881