An Efficient SVM-Based Feature Selection Model for Cancer Classification Using High-Dimensional Microarray Data
Creators
- 1. Menoufia University
- 2. Laboratoire d'Informatique de Paris-Nord
- 3. Nile University
- 4. Abdelmalek Essaâdi University
- 5. Amran University
- 6. Cairo University
- 7. Wenzhou Medical University
- 8. First Affiliated Hospital of Wenzhou Medical University
Description
Feature selection is critical in analyzing microarray data, which has many features (genes) or dimensions.However, with only a few samples, the large search space and time consumed during their selection make selecting relevant and informative genes that improve classification performance a complex task.This paper proposed a hybrid model for gene selection known as (SVM-mRMRe).The proposed model provides a framework for combining filter-based, ensemble, and embedded methods to select the most relevant and informative genes from high-dimensional microarray data by fusing embedded SVM coefficients (features ranking) with ensemble mRMRe.Eight of the most commonly used microarray datasets for various types of cancer were used to evaluate the model.The selected subset feature is evaluated by four different types of classifiers: random forest (RF), multilayer perceptron (MLP), k-nearest neighbors (k-NN), and Support Vector Machine (SVM).The experimental results show that the proposed model reduces time consumption and dimensionality and improves the differentiation of cancer tissues from benign tissues.Furthermore, the selected genes for the brain cancer dataset are biologically interpreted, and it agrees with the findings of relevant biomedical studies and plays an important role in patient prognosis.
Translated Descriptions
Translated Description (Arabic)
يعد اختيار الميزات أمرًا بالغ الأهمية في تحليل بيانات المصفوفات الدقيقة، والتي تحتوي على العديد من الميزات (الجينات) أو الأبعاد. ومع ذلك، مع وجود عينات قليلة فقط، فإن مساحة البحث الكبيرة والوقت المستهلك أثناء اختيارها تجعل اختيار الجينات ذات الصلة والمفيدة التي تحسن أداء التصنيف مهمة معقدة. اقترحت هذه الورقة نموذجًا هجينًا لاختيار الجينات يعرف باسم (SVM - mRMRe). يوفر النموذج المقترح إطارًا للجمع بين الأساليب القائمة على الفلتر والمجموعة والمضمنة لاختيار الجينات الأكثر صلة وغنية بالمعلومات من بيانات المصفوفات الدقيقة عالية الأبعاد عن طريق دمج معاملات SVM المضمنة (ترتيب الميزات) مع مجموعة mRMRe. تم استخدام ثمانية من مجموعات بيانات المصفوفات الدقيقة الأكثر استخدامًا لأنواع مختلفة من السرطان لتقييم النموذج. يتم تقييم ميزة المجموعة الفرعية المختارة من خلال أربعة أنواع مختلفة من المصنفات: الغابات العشوائية (RF)، والمدرك متعدد الطبقات (MLP)، والجيران الأقرب (k - NN)، وآلة ناقلات الدعم (SVM). تظهر النتائج التجريبية أن النموذج المقترح يقلل من استهلاك الوقت والأبعاد ويحسن تمايز أنسجة السرطان عن الأنسجة الحميدة. علاوة على ذلك، يتم تفسير الجينات المختارة لمجموعة بيانات سرطان الدماغ بيولوجيًا، وتتفق مع نتائج الدراسات الطبية الحيوية ذات الصلة وتلعب دورًا مهمًا في تشخيص المريض.Translated Description (French)
La sélection des caractéristiques est essentielle dans l'analyse des données de microréseaux, qui ont de nombreuses caractéristiques (gènes) ou dimensions.Toutefois, avec seulement quelques échantillons, le grand espace de recherche et le temps consommé lors de leur sélection font de la sélection de gènes pertinents et informatifs qui améliorent les performances de classification une tâche complexe.Cet article a proposé un modèle hybride pour la sélection de gènes connu sous le nom de (SVM-mRMRe).Le modèle proposé fournit un cadre pour combiner des méthodes basées sur des filtres, des ensembles et des méthodes intégrées pour sélectionner les gènes les plus pertinents et informatifs à partir de données de microréseaux à haute dimension en fusionnant des coefficients SVM intégrés (classement des caractéristiques) avec l'ensemble mRMRe.Huit des ensembles de données de microréseaux les plus couramment utilisés pour divers types de cancer ont été utilisés pour évaluer le modèle.La caractéristique du sous-ensemble sélectionné est évaluée par quatre types de classificateurs différents : forêt aléatoire (RF), perceptron multicouche (MLP), k plus proches voisins (k-NN) et machine à vecteurs de soutien (SVM).Les résultats expérimentaux montrent que le modèle proposé réduit la consommation de temps et la dimensionnalité et améliore la différenciation des tissus cancéreux des tissus bénins.En outre, les gènes sélectionnés pour l'ensemble de données sur le cancer du cerveau sont interprétés biologiquement, et il est en accord avec le résultats d'études biomédicales pertinentes et joue un rôle important dans le pronostic du patient.Translated Description (Spanish)
La selección de características es fundamental para analizar los datos de micromatrices, que tienen muchas características (genes) o dimensiones. Sin embargo, con solo unas pocas muestras, el gran espacio de búsqueda y el tiempo consumido durante su selección hacen que la selección de genes relevantes e informativos que mejoran el rendimiento de la clasificación sea una tarea compleja. Este documento propone un modelo híbrido para la selección de genes conocido como (SVM-mRMRe). El modelo propuesto proporciona un marco para combinar métodos basados en filtros, conjuntos e integrados para seleccionar los genes más relevantes e informativos a partir de datos de micromatrices de alta dimensión fusionando coeficientes SVM integrados (clasificación de características) con conjunto mRMRe. Para evaluar el modelo se utilizaron ocho de los conjuntos de datos de micromatrices más utilizados para varios tipos de cáncer. La característica del subconjunto seleccionado se evalúa mediante cuatro tipos diferentes de clasificadores: bosque aleatorio (RF), perceptrón multicapa (MLP), vecinos más cercanos a k (k-NN) y máquina de vectores de soporte (SVM). Los resultados experimentales muestran que el modelo propuesto reduce el consumo de tiempo y la dimensionalidad y mejora la diferenciación de los tejidos cancerosos de los tejidos benignos. Además, los genes seleccionados para el conjunto de datos de cáncer cerebral se interpretan biológicamente y están de acuerdo con el hallazgos de estudios biomédicos relevantes y juega un papel importante en el pronóstico del paciente.Files
09585477.pdf.pdf
Files
(245 Bytes)
| Name | Size | Download all |
|---|---|---|
|
md5:54c14b5313121c38d794613774e774f3
|
245 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- نموذج فعال لاختيار الميزات القائمة على SVM لتصنيف السرطان باستخدام بيانات المصفوفات الدقيقة عالية الأبعاد
- Translated title (French)
- Un modèle de sélection de caractéristiques efficace basé sur SVM pour la classification du cancer à l'aide de données de microréseaux à haute dimension
- Translated title (Spanish)
- Un modelo eficiente de selección de características basado en SVM para la clasificación del cáncer utilizando datos de micromatrices de alta dimensión
Identifiers
- Other
- https://openalex.org/W3208477548
- DOI
- 10.1109/access.2021.3123090
References
- https://openalex.org/W187383851
- https://openalex.org/W1493357981
- https://openalex.org/W1985871111
- https://openalex.org/W2087684630
- https://openalex.org/W2088252378
- https://openalex.org/W2088851040
- https://openalex.org/W2100631457
- https://openalex.org/W2109363337
- https://openalex.org/W2122683221
- https://openalex.org/W2127938920
- https://openalex.org/W2131987814
- https://openalex.org/W2133000300
- https://openalex.org/W2140881839
- https://openalex.org/W2141826465
- https://openalex.org/W2143426320
- https://openalex.org/W2146535457
- https://openalex.org/W2159400887
- https://openalex.org/W2168561598
- https://openalex.org/W2169171650
- https://openalex.org/W2235523093
- https://openalex.org/W2937767865
- https://openalex.org/W2942615852
- https://openalex.org/W2949607402
- https://openalex.org/W2989385256
- https://openalex.org/W3000991033
- https://openalex.org/W3005468664
- https://openalex.org/W3007616454
- https://openalex.org/W3082542298
- https://openalex.org/W3115407590
- https://openalex.org/W3125493009
- https://openalex.org/W3135383184
- https://openalex.org/W3137846178
- https://openalex.org/W3170655365
- https://openalex.org/W3174323028