Efficient pulmonary nodules classification using radiomics and different artificial intelligence strategies
- 1. Helwan University
- 2. Badr University in Cairo
Description
This study aimed to explore and develop artificial intelligence approaches for efficient classification of pulmonary nodules based on CT scans.A number of 1007 nodules were obtained from 551 patients of LIDC-IDRI dataset. All nodules were cropped into 64 × 64 PNG images , and preprocessing was carried out to clean the image from surrounding non-nodular structure. In machine learning method, texture Haralick and local binary pattern features were extracted. Four features were selected using principal component analysis (PCA) algorithm before running classifiers. In deep learning, a simple CNN model was constructed and transfer learning was applied using VGG-16 and VGG-19, DenseNet-121 and DenseNet-169 and ResNet as pre-trained models with fine tuning.In statistical machine learning method, the optimal AUROC was 0.885 ± 0.024 with random forest classifier and the best accuracy was 0.819 ± 0.016 with support vector machine. In deep learning, the best accuracy reached 90.39% with DenseNet-121 model and the best AUROC was 96.0%, 95.39% and 95.69% with simple CNN, VGG-16 and VGG-19, respectively. The best sensitivity reached 90.32% using DenseNet-169 and the best specificity attained was 93.65% when applying the DenseNet-121 and ResNet-152V2.Deep learning methods with transfer learning showed several benefits over statistical learning in terms of nodule prediction performance and saving efforts and time in training large datasets. SVM and DenseNet-121 showed the best performance when compared with their counterparts. There is still more room for improvement, especially when more data can be trained and lesion volume is represented in 3D.Machine learning methods offer unique opportunities and open new venues in clinical diagnosis of lung cancer. The deep learning approach has been more accurate than statistical learning methods. SVM and DenseNet-121 showed superior performance in pulmonary nodule classification.
Translated Descriptions
Translated Description (Arabic)
تهدف هذه الدراسة إلى استكشاف وتطوير مناهج الذكاء الاصطناعي للتصنيف الفعال للعقيدات الرئوية بناءً على الأشعة المقطعية. تم الحصول على عدد 1007 عقدة من 551 مريضًا من مجموعة بيانات LIDC - IDRI. تم اقتصاص جميع العقيدات إلى صور PNG 64 × 64، وتم إجراء المعالجة المسبقة لتنظيف الصورة من الهيكل غير العقدي المحيط. في طريقة التعلم الآلي، تم استخراج الملمس Haralick وميزات النمط الثنائي المحلي. تم اختيار أربع ميزات باستخدام خوارزمية تحليل المكونات الرئيسية (PCA) قبل تشغيل المصنفات. في التعلم العميق، تم بناء نموذج CNN بسيط وتم تطبيق تعلم النقل باستخدام VGG -16 و VGG -19 و DenseNet -121 و DenseNet -169 و ResNet كنماذج مدربة مسبقًا مع الضبط الدقيق. في طريقة التعلم الآلي الإحصائي، كان AUROC الأمثل 0.885 ± 0.024 مع مصنف عشوائي للغابات وكانت أفضل دقة 0.819 ± 0.016 مع آلة ناقل الدعم. في التعلم العميق، وصلت أفضل دقة إلى 90.39 ٪ مع نموذج DenseNet -121 وكانت أفضل AUROC هي 96.0 ٪ و 95.39 ٪ و 95.69 ٪ مع CNN و VGG -16 و VGG -19 على التوالي. وصلت أفضل حساسية إلى 90.32 ٪ باستخدام DenseNet -169 وكانت أفضل خصوصية تم تحقيقها 93.65 ٪ عند تطبيق DenseNet -121 و ResNet -152V2. أظهرت طرق التعلم العميقة مع تعلم النقل العديد من الفوائد على التعلم الإحصائي من حيث أداء التنبؤ بالعقيدات وتوفير الجهود والوقت في تدريب مجموعات البيانات الكبيرة. أظهرت SVM و DenseNet -121 أفضل أداء عند مقارنتها بنظيراتها. لا يزال هناك مجال أكبر للتحسين، خاصة عندما يمكن تدريب المزيد من البيانات ويتم تمثيل حجم الآفة في 3D. توفر طرق التعلم الآلي فرصًا فريدة وتفتح أماكن جديدة في التشخيص السريري لسرطان الرئة. كان نهج التعلم العميق أكثر دقة من أساليب التعلم الإحصائي. أظهر SVM و DenseNet -121 أداءً فائقًا في تصنيف العقيدات الرئوية.Translated Description (French)
Cette étude visait à explorer et à développer des approches d'intelligence artificielle pour une classification efficace des nodules pulmonaires sur la base de tomodensitogrammes. Un nombre de 1007 nodules a été obtenu chez 551 patients de l'ensemble de données LIDC-IDRI. Tous les nodules ont été recadrés en images PNG 64 × 64, et un prétraitement a été effectué pour nettoyer l'image de la structure non nodulaire environnante. Dans la méthode d'apprentissage automatique, les caractéristiques de texture Haralick et de motif binaire local ont été extraites. Quatre caractéristiques ont été sélectionnées à l'aide de l'algorithme d'analyse en composantes principales (ACP) avant d'exécuter les classificateurs. En apprentissage profond, un modèle CNN simple a été construit et l'apprentissage par transfert a été appliqué en utilisant VGG-16 et VGG-19, DenseNet-121 et DenseNet-169 et ResNet comme modèles pré-entraînés avec un réglage fin. Dans la méthode d'apprentissage automatique statistique, l'AUROC optimal était de 0,885 ± 0,024 avec un classificateur de forêt aléatoire et la meilleure précision était de 0,819 ± 0,016 avec une machine vectorielle de support. En apprentissage profond, la meilleure précision a atteint 90,39 % avec le modèle DenseNet-121 et la meilleure AUROC était de 96,0 %, 95,39 % et 95,69 % avec CNN simple, VGG-16 et VGG-19, respectivement. La meilleure sensibilité a atteint 90,32 % en utilisant DenseNet-169 et la meilleure spécificité atteinte était de 93,65 % lors de l'application du DenseNet-121 et du ResNet-152V2. Les méthodes d'apprentissage approfondies avec apprentissage par transfert ont montré plusieurs avantages par rapport à l'apprentissage statistique en termes de performance de prédiction des nodules et d'économie d'efforts et de temps dans la formation de grands ensembles de données. SVM et DenseNet-121 ont montré les meilleures performances par rapport à leurs homologues. Il reste encore beaucoup à faire, en particulier lorsque davantage de données peuvent être formées et que le volume des lésions est représenté en 3D. Les méthodes d'apprentissage automatique offrent des opportunités uniques et ouvrent de nouveaux horizons pour le diagnostic clinique du cancer du poumon. L'approche d'apprentissage en profondeur a été plus précise que les méthodes d'apprentissage statistique. SVM et DenseNet-121 ont montré des performances supérieures dans la classification des nodules pulmonaires.Translated Description (Spanish)
Este estudio tuvo como objetivo explorar y desarrollar enfoques de inteligencia artificial para una clasificación eficiente de los nódulos pulmonares basada en tomografías computarizadas. Se obtuvieron un número de 1007 nódulos de 551 pacientes del conjunto de datos LIDC-IDRI. Todos los nódulos se recortaron en imágenes PNG de 64 × 64, y se llevó a cabo el preprocesamiento para limpiar la imagen de la estructura no nodular circundante. En el método de aprendizaje automático, se extrajeron la textura de Haralick y las características del patrón binario local. Se seleccionaron cuatro características utilizando el algoritmo de análisis de componentes principales (PCA) antes de ejecutar los clasificadores. En el aprendizaje profundo, se construyó un modelo CNN simple y se aplicó el aprendizaje por transferencia utilizando VGG-16 y VGG-19, DenseNet-121 y DenseNet-169 y ResNet como modelos preentrenados con ajuste fino. En el método estadístico de aprendizaje automático, el AUROC óptimo fue de 0.885 ± 0.024 con clasificador de bosque aleatorio y la mejor precisión fue de 0.819 ± 0.016 con máquina de vectores de soporte. En aprendizaje profundo, la mejor precisión alcanzó el 90,39% con el modelo DenseNet-121 y el mejor AUROC fue del 96,0%, 95,39% y 95,69% con CNN simple, VGG-16 y VGG-19, respectivamente. La mejor sensibilidad alcanzó el 90,32% utilizando DenseNet-169 y la mejor especificidad alcanzada fue del 93,65% al aplicar DenseNet-121 y ResNet-152V2. Los métodos de aprendizaje profundo con aprendizaje de transferencia mostraron varios beneficios sobre el aprendizaje estadístico en términos de rendimiento de predicción de nódulos y ahorro de esfuerzos y tiempo en la capacitación de grandes conjuntos de datos. SVM y DenseNet-121 mostraron el mejor rendimiento en comparación con sus contrapartes. Todavía hay más margen de mejora, especialmente cuando se pueden entrenar más datos y el volumen de la lesión se representa en 3D. Los métodos de aprendizaje automático ofrecen oportunidades únicas y abren nuevos espacios en el diagnóstico clínico del cáncer de pulmón. El enfoque de aprendizaje profundo ha sido más preciso que los métodos de aprendizaje estadístico. SVM y DenseNet-121 mostraron un rendimiento superior en la clasificación de nódulos pulmonares.Files
s13244-023-01441-6.pdf
Files
(2.0 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:913ee9c2146afdcc77819ab02a3a93f6
|
2.0 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- تصنيف العقيدات الرئوية بكفاءة باستخدام علم الأشعة واستراتيجيات الذكاء الاصطناعي المختلفة
- Translated title (French)
- Classification efficace des nodules pulmonaires à l'aide de la radiomique et de différentes stratégies d'intelligence artificielle
- Translated title (Spanish)
- Clasificación eficiente de los nódulos pulmonares mediante radiomica y diferentes estrategias de inteligencia artificial
Identifiers
- Other
- https://openalex.org/W4377010708
- DOI
- 10.1186/s13244-023-01441-6
References
- https://openalex.org/W2044465660
- https://openalex.org/W2083927153
- https://openalex.org/W2593490899
- https://openalex.org/W2753801833
- https://openalex.org/W2756459689
- https://openalex.org/W2765931871
- https://openalex.org/W2951211570
- https://openalex.org/W3048802680
- https://openalex.org/W3126347848
- https://openalex.org/W3160643432
- https://openalex.org/W3171436770
- https://openalex.org/W3204217350
- https://openalex.org/W3205051663
- https://openalex.org/W4200153631
- https://openalex.org/W4297361208
- https://openalex.org/W4298082496