A Diagnostic Model of Breast Cancer Based on Digital Mammogram Images Using Machine Learning Techniques
Creators
- 1. Ibb University
- 2. University of Science and Technology
Description
Breast cancer disease is one of the most recorded cancers that lead to morbidity and maybe death among women around the world. Recent research statistics have exposed that one from 8 females in the USA and one from 10 females in Europe are contaminated by breast cancer. The challenge with this disease is how to develop a relaxed and fast diagnosing method. One of the attractive ways of early breast cancer diagnosis is based on the mammogram images analysis of the breast using a computer-aided diagnosing (CAD) tool. This paper firstly aimed to propose an efficient method for diagnosing tumors based on mammogram images of breasts using a machine learning approach. Secondly, this paper aimed to the development of a CAD software program for breast cancer diagnosing based on the proposed method in the first step. The followed step-by-step procedure of the proposed method is performed by passing the Mammographic Image Analysis Society (MIAS) through five steps of image preprocessing, image segmentation using seeded region growing (SRG) algorithm, feature extraction using different feature's extraction classes, and important and effectiveness feature selection using the Sequential Forward Selection (SFS) technique, and finally, the Support Vector Machine (SVM) algorithm is used as a binary classifier in two classification levels. The first level classifier is used to categorize the given image as normal or abnormal while the second-level classifier is used for further classifying the abnormal image as either a malignant or benign cancer. The proposed method is studied and investigated in two phases: the training phase and the testing phase, with the MIAS dataset of mammogram images, using 70% and 30% ratios of dataset images for the training and testing sets, respectively. The practical implementation of the proposed method and the graphical user interface (GUI) CAD tool are carried out using MATLAB software. Experimental results of the proposed method have shown that the accuracy of the proposed method reached 100% in classifying images as normal and abnormal mammogram images while the classification accuracy for benign and malignant is equal to 87.1%.
Translated Descriptions
Translated Description (Arabic)
مرض سرطان الثدي هو واحد من أكثر أنواع السرطان المسجلة التي تؤدي إلى الاعتلال وربما الموت بين النساء في جميع أنحاء العالم. كشفت إحصائيات الأبحاث الحديثة أن واحدة من 8 إناث في الولايات المتحدة الأمريكية وواحدة من 10 إناث في أوروبا مصابات بسرطان الثدي. التحدي مع هذا المرض هو كيفية تطوير طريقة تشخيص مريحة وسريعة. تعتمد إحدى الطرق الجذابة للتشخيص المبكر لسرطان الثدي على تحليل صور الثدي الشعاعية للثدي باستخدام أداة التشخيص بمساعدة الكمبيوتر (CAD). تهدف هذه الورقة أولاً إلى اقتراح طريقة فعالة لتشخيص الأورام بناءً على صور الماموجرام للثدي باستخدام نهج التعلم الآلي. ثانياً، هدفت هذه الورقة إلى تطوير برنامج CAD لتشخيص سرطان الثدي بناءً على الطريقة المقترحة في الخطوة الأولى. يتم تنفيذ الإجراء التدريجي المتبع للطريقة المقترحة من خلال اجتياز جمعية تحليل الصور الماموغرافية (MIAs) من خلال خمس خطوات من المعالجة المسبقة للصور، وتجزئة الصور باستخدام خوارزمية نمو المنطقة المصنفة (SRG)، واستخراج الميزات باستخدام فئات استخراج الميزات المختلفة، واختيار الميزات المهمة والفعالة باستخدام تقنية التحديد المتسلسل للأمام (SFS)، وأخيرًا، يتم استخدام خوارزمية آلة متجه الدعم (SVM) كمصنف ثنائي في مستويين للتصنيف. يتم استخدام مصنف المستوى الأول لتصنيف الصورة المعطاة على أنها طبيعية أو غير طبيعية بينما يتم استخدام مصنف المستوى الثاني لتصنيف الصورة غير الطبيعية على أنها إما سرطان خبيث أو حميد. تتم دراسة الطريقة المقترحة والتحقيق فيها على مرحلتين: مرحلة التدريب ومرحلة الاختبار، مع مجموعة بيانات MIAS لصور التصوير الشعاعي للثدي، باستخدام نسب 70 ٪ و 30 ٪ من صور مجموعة البيانات لمجموعات التدريب والاختبار، على التوالي. يتم التنفيذ العملي للطريقة المقترحة وأداة التصميم بمساعدة الحاسوب لواجهة المستخدم الرسومية باستخدام برنامج ماتلاب. أظهرت النتائج التجريبية للطريقة المقترحة أن دقة الطريقة المقترحة وصلت إلى 100 ٪ في تصنيف الصور كصور تصوير الثدي بالأشعة السينية العادية وغير الطبيعية في حين أن دقة التصنيف للحميدة والخبيثة تساوي 87.1 ٪.Translated Description (French)
La maladie du cancer du sein est l'un des cancers les plus enregistrés qui conduisent à la morbidité et peut-être à la mort chez les femmes du monde entier. Des statistiques de recherche récentes ont révélé qu'une femme sur 8 aux États-Unis et une femme sur 10 en Europe sont contaminées par le cancer du sein. Le défi avec cette maladie est de développer une méthode de diagnostic détendue et rapide. L'un des moyens attrayants de diagnostic précoce du cancer du sein est basé sur l'analyse des images mammographiques du sein à l'aide d'un outil de diagnostic assisté par ordinateur (CAO). Cet article visait tout d'abord à proposer une méthode efficace de diagnostic des tumeurs basée sur des images mammographiques des seins en utilisant une approche d'apprentissage automatique. Deuxièmement, cet article visait le développement d'un logiciel de CAO pour le diagnostic du cancer du sein basé sur la méthode proposée dans la première étape. La procédure étape par étape suivie du procédé proposé est effectuée en passant la Société d'analyse d'image mammographique (SIAM) à travers cinq étapes de prétraitement d'image, de segmentation d'image à l'aide d'un algorithme de croissance de région ensemencée (SRG), d'extraction de caractéristiques à l'aide de classes d'extraction de caractéristiques différentes, et de sélection de caractéristiques importantes et efficaces à l'aide de la technique de sélection directe séquentielle (SFS), et enfin, l'algorithme de machine vectorielle de support (SVM) est utilisé comme classificateur binaire dans deux niveaux de classification. Le classificateur de premier niveau est utilisé pour classer l'image donnée comme normale ou anormale tandis que le classificateur de deuxième niveau est utilisé pour classer davantage l'image anormale comme un cancer malin ou bénin. La méthode proposée est étudiée et étudiée en deux phases : la phase d'entraînement et la phase de test, avec l'ensemble de données SIAM des images de mammographie, en utilisant des ratios de 70 % et 30 % des images de l'ensemble de données pour les ensembles d'entraînement et de test, respectivement. La mise en œuvre pratique de la méthode proposée et l'outil de CAO de l'interface utilisateur graphique (GUI) sont réalisés à l'aide du logiciel Matlab. Les résultats expérimentaux de la méthode proposée ont montré que la précision de la méthode proposée atteignait 100 % dans la classification des images comme des images de mammographie normales et anormales, tandis que la précision de classification pour les tumeurs bénignes et malignes est égale à 87,1 %.Translated Description (Spanish)
La enfermedad del cáncer de mama es uno de los cánceres más registrados que conducen a la morbilidad y tal vez a la muerte entre las mujeres de todo el mundo. Las estadísticas de investigaciones recientes han expuesto que una de cada 8 mujeres en los EE. UU. y una de cada 10 mujeres en Europa están contaminadas por cáncer de mama. El desafío con esta enfermedad es cómo desarrollar un método de diagnóstico relajado y rápido. Una de las formas atractivas de diagnóstico precoz del cáncer de mama se basa en el análisis de imágenes de mamografía de la mama utilizando una herramienta de diagnóstico asistido por ordenador (CAD). Este documento tuvo como objetivo, en primer lugar, proponer un método eficiente para diagnosticar tumores basado en imágenes de mamografía de mamas utilizando un enfoque de aprendizaje automático. En segundo lugar, este trabajo tuvo como objetivo el desarrollo de un programa de software CAD para el diagnóstico del cáncer de mama basado en el método propuesto en el primer paso. El siguiente procedimiento paso a paso del método propuesto se realiza pasando la Sociedad de Análisis de Imágenes Mammográficas (mias) a través de cinco pasos de preprocesamiento de imágenes, segmentación de imágenes utilizando el algoritmo de crecimiento de región sembrada (SRG), extracción de características utilizando diferentes clases de extracción de características, y selección de características importantes y efectivas utilizando la técnica de Selección Secuencial Directa (SFS), y finalmente, el algoritmo de Máquina de Vectores de Soporte (SVM) se utiliza como clasificador binario en dos niveles de clasificación. El clasificador de primer nivel se utiliza para clasificar la imagen dada como normal o anormal, mientras que el clasificador de segundo nivel se utiliza para clasificar aún más la imagen anormal como un cáncer maligno o benigno. El método propuesto se estudia e investiga en dos fases: la fase de entrenamiento y la fase de pruebas, con el conjunto de datos mias DE imágenes de mamografías, utilizando proporciones del 70% y 30% de imágenes de conjuntos de datos para los conjuntos de entrenamiento y pruebas, respectivamente. La implementación práctica del método propuesto y la herramienta CAD de interfaz gráfica de usuario (GUI) se llevan a cabo utilizando el software MATLAB. Los resultados experimentales del método propuesto han demostrado que la precisión del método propuesto alcanzó el 100% en la clasificación de imágenes como imágenes de mamografía normales y anormales, mientras que la precisión de clasificación para benignos y malignos es igual al 87,1%.Files
3895976.pdf.pdf
Files
(4.5 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:692efb2cb7233d449cb4712c7e993d2a
|
4.5 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- نموذج تشخيصي لسرطان الثدي يعتمد على صور الماموجرام الرقمية باستخدام تقنيات التعلم الآلي
- Translated title (French)
- Un modèle diagnostique du cancer du sein basé sur des images de mammographie numérique à l'aide de techniques d'apprentissage automatique
- Translated title (Spanish)
- Un modelo de diagnóstico del cáncer de mama basado en imágenes de mamografías digitales utilizando técnicas de aprendizaje automático
Identifiers
- Other
- https://openalex.org/W4296784316
- DOI
- 10.1155/2022/3895976
References
- https://openalex.org/W657953742
- https://openalex.org/W1168606003
- https://openalex.org/W1605637633
- https://openalex.org/W2001954668
- https://openalex.org/W2021483074
- https://openalex.org/W2021841162
- https://openalex.org/W2050997943
- https://openalex.org/W2052380666
- https://openalex.org/W2059432853
- https://openalex.org/W2073949560
- https://openalex.org/W2096579040
- https://openalex.org/W2109597745
- https://openalex.org/W2129440600
- https://openalex.org/W2130999406
- https://openalex.org/W2151281402
- https://openalex.org/W2151608510
- https://openalex.org/W2169105664
- https://openalex.org/W2171745318
- https://openalex.org/W2225888838
- https://openalex.org/W2370924594
- https://openalex.org/W2413293061
- https://openalex.org/W2539721244
- https://openalex.org/W2542345071
- https://openalex.org/W2569219946
- https://openalex.org/W2773381949
- https://openalex.org/W2784133841
- https://openalex.org/W2793956967
- https://openalex.org/W2908849530
- https://openalex.org/W2909563883
- https://openalex.org/W2912469452
- https://openalex.org/W2918663279
- https://openalex.org/W2918834327
- https://openalex.org/W2971800190
- https://openalex.org/W2980379857
- https://openalex.org/W3011917823
- https://openalex.org/W3032922664
- https://openalex.org/W3092135811
- https://openalex.org/W3118625667
- https://openalex.org/W3119779909
- https://openalex.org/W3126120540
- https://openalex.org/W3142026135
- https://openalex.org/W3154190814
- https://openalex.org/W4200492002
- https://openalex.org/W4200566850
- https://openalex.org/W4206646040
- https://openalex.org/W4214647931
- https://openalex.org/W4223422573
- https://openalex.org/W4223513451
- https://openalex.org/W4235568334