A novel SVM Kernel Classifier Technique using Support Vector Machine for Breast Cancer Classification
Creators
- 1. Chitkara University
- 2. Vellore Institute of Technology University
- 3. Princess Nourah bint Abdulrahman University
- 4. King Khalid University
- 5. University of Sousse
Description
Abstract Breast cancer prediction is an important topic in the field of healthcare. Breast cancer is one of the most common cancers in women and early detection is critical for successful treatment. There are several methods for predicting breast cancer, including imaging studies, genetic testing, and risk assessment models. Early detection can greatly improve the chances of successful treatment and long-term survival. One approach to detecting breast cancer is to use machine learning algorithms such as support vector machine (SVM) classifiers. SVMs are a popular type of supervised learning algorithm that can be used for classification or regression analysis. To use SVMs for breast cancer classification, you need to first prepare the data by dividing it into training and testing sets. The training set is used to train the SVM model, and the testing set is used to evaluate the performance of the model. The SVM model learns to classify the data by adjusting the parameters of the kernel function. In this paper, the performance of Linear, Polynomial, Gaussian and Sigmoid machine-learning kernels in the Support Vector Machine method was investigated to determine which kernel classifier is better at diagnosing breast cancer. In addition, this study made usage of the Wisconsin Breast Cancer (Diagnostic) dataset that contains 569 occurrences and 32 features for analysis. The major objective of this study is to compare a variety of kernel classifiers to identify the one that provides the best accuracy. Linear kernel support vector machine was shown to have the highest accuracy (97.90%) and lowest false discovery rates in this investigation. In contrast, other kernels and classification algorithms show low performance, which may not be more accurate in breast cancer prediction.
Translated Descriptions
Translated Description (Arabic)
يعد التنبؤ بسرطان الثدي موضوعًا مهمًا في مجال الرعاية الصحية. سرطان الثدي هو واحد من أكثر أنواع السرطان شيوعًا لدى النساء والكشف المبكر عنه أمر بالغ الأهمية لنجاح العلاج. هناك عدة طرق للتنبؤ بسرطان الثدي، بما في ذلك دراسات التصوير والاختبارات الجينية ونماذج تقييم المخاطر. يمكن أن يحسن الكشف المبكر بشكل كبير من فرص العلاج الناجح والبقاء على قيد الحياة على المدى الطويل. تتمثل إحدى الطرق للكشف عن سرطان الثدي في استخدام خوارزميات التعلم الآلي مثل مصنفات آلة ناقلات الدعم (SVM). SVMs هي نوع شائع من خوارزميات التعلم الخاضعة للإشراف والتي يمكن استخدامها للتصنيف أو تحليل الانحدار. لاستخدام SVMs لتصنيف سرطان الثدي، تحتاج أولاً إلى إعداد البيانات عن طريق تقسيمها إلى مجموعات تدريب واختبار. يتم استخدام مجموعة التدريب لتدريب نموذج SVM، ويتم استخدام مجموعة الاختبار لتقييم أداء النموذج. يتعلم نموذج SVM تصنيف البيانات عن طريق ضبط معلمات وظيفة النواة. في هذه الورقة، تم التحقيق في أداء حبات التعلم الآلي الخطية ومتعددة الحدود والغاوسية والسينية في طريقة آلة ناقلات الدعم لتحديد مصنف النواة الأفضل في تشخيص سرطان الثدي. بالإضافة إلى ذلك، استخدمت هذه الدراسة مجموعة بيانات ويسكونسن لسرطان الثدي (التشخيص) التي تحتوي على 569 حدثًا و 32 ميزة للتحليل. الهدف الرئيسي من هذه الدراسة هو مقارنة مجموعة متنوعة من مصنفات النواة لتحديد المصنف الذي يوفر أفضل دقة. تبين أن آلة متجه دعم النواة الخطية تتمتع بأعلى دقة (97.90 ٪) وأدنى معدلات اكتشاف كاذبة في هذا التحقيق. في المقابل، تظهر النوى الأخرى وخوارزميات التصنيف أداءً منخفضًا، والذي قد لا يكون أكثر دقة في التنبؤ بسرطان الثدي.Translated Description (French)
Résumé La prédiction du cancer du sein est un sujet important dans le domaine de la santé. Le cancer du sein est l'un des cancers les plus courants chez les femmes et une détection précoce est essentielle à la réussite du traitement. Il existe plusieurs méthodes pour prédire le cancer du sein, y compris des études d'imagerie, des tests génétiques et des modèles d'évaluation des risques. Une détection précoce peut grandement améliorer les chances de succès du traitement et de survie à long terme. Une approche pour détecter le cancer du sein consiste à utiliser des algorithmes d'apprentissage automatique tels que les classificateurs de machine à vecteur de support (SVM). Les SVM sont un type populaire d'algorithme d'apprentissage supervisé qui peut être utilisé pour la classification ou l'analyse de régression. Pour utiliser les SVM pour la classification du cancer du sein, vous devez d'abord préparer les données en les divisant en ensembles de formation et de test. L'ensemble de formation est utilisé pour former le modèle SVM, et l'ensemble de test est utilisé pour évaluer les performances du modèle. Le modèle SVM apprend à classer les données en ajustant les paramètres de la fonction noyau. Dans cet article, la performance des noyaux d'apprentissage machine linéaires, polynomiaux, gaussiens et sigmoïdes dans la méthode de la machine vectorielle de support a été étudiée pour déterminer quel classificateur de noyau est meilleur pour diagnostiquer le cancer du sein. En outre, cette étude a utilisé l'ensemble de données sur le cancer du sein (diagnostic) du Wisconsin qui contient 569 occurrences et 32 caractéristiques à analyser. L'objectif principal de cette étude est de comparer une variété de classificateurs de noyau pour identifier celui qui fournit la meilleure précision. Il a été démontré que la machine vectorielle de prise en charge du noyau linéaire avait la plus grande précision (97,90 %) et les taux de fausses découvertes les plus bas dans cette enquête. En revanche, d'autres noyaux et algorithmes de classification montrent de faibles performances, ce qui peut ne pas être plus précis dans la prédiction du cancer du sein.Translated Description (Spanish)
Resumen La predicción del cáncer de mama es un tema importante en el campo de la salud. El cáncer de mama es uno de los cánceres más comunes en las mujeres y la detección temprana es fundamental para el éxito del tratamiento. Existen varios métodos para predecir el cáncer de mama, incluidos estudios de imágenes, pruebas genéticas y modelos de evaluación de riesgos. La detección temprana puede mejorar en gran medida las posibilidades de éxito del tratamiento y la supervivencia a largo plazo. Un enfoque para detectar el cáncer de mama es utilizar algoritmos de aprendizaje automático, como los clasificadores de máquinas de vectores de soporte (SVM). Los SVM son un tipo popular de algoritmo de aprendizaje supervisado que se puede utilizar para la clasificación o el análisis de regresión. Para utilizar las SVM para la clasificación del cáncer de mama, primero debe preparar los datos dividiéndolos en conjuntos de entrenamiento y pruebas. El conjunto de entrenamiento se utiliza para entrenar el modelo SVM, y el conjunto de pruebas se utiliza para evaluar el rendimiento del modelo. El modelo SVM aprende a clasificar los datos ajustando los parámetros de la función kernel. En este artículo, se investigó el rendimiento de los núcleos de aprendizaje automático Linear, Polynomial, Gaussian y Sigmoid en el método Support Vector Machine para determinar qué clasificador de núcleo es mejor para diagnosticar el cáncer de mama. Además, este estudio hizo uso del conjunto de datos de Wisconsin Breast Cancer (Diagnostic) que contiene 569 ocurrencias y 32 características para el análisis. El objetivo principal de este estudio es comparar una variedad de clasificadores de núcleo para identificar el que proporciona la mejor precisión. Se demostró que la máquina vectorial de soporte de núcleo lineal tiene la mayor precisión (97.90%) y las tasas de descubrimiento falso más bajas en esta investigación. Por el contrario, otros núcleos y algoritmos de clasificación muestran un bajo rendimiento, que puede no ser más preciso en la predicción del cáncer de mama.Additional details
Additional titles
- Translated title (Arabic)
- تقنية جديدة لتصنيف نواة SVM باستخدام آلة ناقلات الدعم لتصنيف سرطان الثدي
- Translated title (French)
- Une nouvelle technique de classification du noyau SVM utilisant une machine à vecteurs de soutien pour la classification du cancer du sein
- Translated title (Spanish)
- Una novedosa técnica de clasificación de granos SVM utilizando una máquina de vectores de soporte para la clasificación del cáncer de mama
Identifiers
- Other
- https://openalex.org/W4366829006
- DOI
- 10.21203/rs.3.rs-2820379/v1
References
- https://openalex.org/W2290408072
- https://openalex.org/W2885575853
- https://openalex.org/W2929959569
- https://openalex.org/W2990041205
- https://openalex.org/W2990936323
- https://openalex.org/W3014253013
- https://openalex.org/W3019022544
- https://openalex.org/W3036906813
- https://openalex.org/W3094910079
- https://openalex.org/W3095321132
- https://openalex.org/W3096802791
- https://openalex.org/W3124608938
- https://openalex.org/W3136420378
- https://openalex.org/W3138200812
- https://openalex.org/W3138525496
- https://openalex.org/W3144321749
- https://openalex.org/W3166048947
- https://openalex.org/W3194344623
- https://openalex.org/W3200221702
- https://openalex.org/W3212007999
- https://openalex.org/W3217435343
- https://openalex.org/W4200567187
- https://openalex.org/W4225360065
- https://openalex.org/W4226073575