Stable ant‐antlion optimiser for feature selection on high‐dimensional data
- 1. National University of Defense Technology
- 2. Beijing Institute of Big Data Research
- 3. Chinese PLA General Hospital
Description
High-dimensional data exists widely in the real world, such as gene, magnetic resonance imaging (MRI), text, web data and so on. Feature selection is an effective and powerful method that is often adopted to reduce dimensions of high-dimensional data for promoting learning algorithm's ability to obtain useful information from them. However, feature selection stability lacks attention for a long time, which plays an important role in getting compelling results. This study proposes a stable feature selection approach called stable ant-antlion optimiser (SALO) that is a modified hybrid evolutionary method combining ant colony optimisation and antlion optimiser. Several relative stable filter methods are employed to rank features as guide information, fisher discriminant rate is used to evaluate features as heuristic information, and F1 indicator and the similarity between feature subset and stable ranked feature list are taken as optimisation objects. Comprehensive experiments show the fantasy stability and excellent classification performance of our proposed sophisticated method.
Translated Descriptions
Translated Description (Arabic)
توجد بيانات عالية الأبعاد على نطاق واسع في العالم الحقيقي، مثل الجينات والتصوير بالرنين المغناطيسي والنص وبيانات الويب وما إلى ذلك. يعد اختيار الميزة طريقة فعالة وقوية يتم اعتمادها غالبًا لتقليل أبعاد البيانات عالية الأبعاد لتعزيز قدرة خوارزمية التعلم على الحصول على معلومات مفيدة منها. ومع ذلك، فإن استقرار اختيار الميزات يفتقر إلى الاهتمام لفترة طويلة، مما يلعب دورًا مهمًا في الحصول على نتائج مقنعة. تقترح هذه الدراسة نهجًا مستقرًا لاختيار الميزات يسمى محسن مستقر ضد الأنتليون (SALO) وهو طريقة تطورية هجينة معدلة تجمع بين تحسين مستعمرة النمل ومحسن الأنتليون. يتم استخدام العديد من طرق التصفية المستقرة نسبيًا لتصنيف الميزات كمعلومات إرشادية، ويتم استخدام معدل تمييز الصياد لتقييم الميزات كمعلومات إرشادية، ويتم اعتبار مؤشر F1 والتشابه بين المجموعة الفرعية للميزات وقائمة الميزات المصنفة المستقرة ككائنات تحسين. تُظهر التجارب الشاملة الاستقرار الخيالي وأداء التصنيف الممتاز لطريقتنا المتطورة المقترحة.Translated Description (French)
Les données de grande dimension existent largement dans le monde réel, telles que les gènes, l'imagerie par résonance magnétique (IRM), le texte, les données Web, etc. La sélection des fonctionnalités est une méthode efficace et puissante qui est souvent adoptée pour réduire les dimensions des données de grande dimension afin de promouvoir la capacité de l'algorithme d'apprentissage à en obtenir des informations utiles. Cependant, la stabilité de la sélection des caractéristiques manque d'attention pendant longtemps, ce qui joue un rôle important dans l'obtention de résultats convaincants. Cette étude propose une approche de sélection de caractéristiques stables appelée optimisation stable des fourmis-antlions (SALO) qui est une méthode évolutive hybride modifiée combinant l'optimisation des colonies de fourmis et l'optimisation des fourmis. Plusieurs méthodes de filtre relativement stables sont utilisées pour classer les caractéristiques en tant qu'informations guides, le taux de discriminant Fisher est utilisé pour évaluer les caractéristiques en tant qu'informations heuristiques, et l'indicateur F1 et la similitude entre le sous-ensemble de caractéristiques et la liste de caractéristiques classées stables sont pris en tant qu'objets d'optimisation. Des expériences complètes montrent la stabilité fantaisiste et les excellentes performances de classification de notre méthode sophistiquée proposée.Translated Description (Spanish)
Los datos de alta dimensión existen ampliamente en el mundo real, como genes, imágenes de resonancia magnética (IRM), texto, datos web, etc. La selección de características es un método eficaz y poderoso que a menudo se adopta para reducir las dimensiones de los datos de alta dimensión para promover la capacidad del algoritmo de aprendizaje para obtener información útil de ellos. Sin embargo, la estabilidad de la selección de características carece de atención durante mucho tiempo, lo que juega un papel importante en la obtención de resultados convincentes. Este estudio propone un enfoque de selección de características estable llamado optimizador estable de hormigas león (SALO) que es un método evolutivo híbrido modificado que combina la optimización de colonias de hormigas y el optimizador de hormigas león. Se emplean varios métodos de filtro relativamente estables para clasificar las características como información guía, la tasa discriminante de pescadores se utiliza para evaluar las características como información heurística, y el indicador F1 y la similitud entre el subconjunto de características y la lista de características clasificadas estables se toman como objetos de optimización. Los experimentos exhaustivos muestran la estabilidad de la fantasía y el excelente rendimiento de clasificación de nuestro sofisticado método propuesto.Files
ell2.12083.pdf
Files
(16.0 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:9a44cab503170d1397889e435610440a
|
16.0 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- محسّن مستقر مضاد للأنتاليون لاختيار الميزات في البيانات عاليةالأبعاد
- Translated title (French)
- Optimiseur de fourmis stable pour la sélection de caractéristiques sur des données de grande dimension
- Translated title (Spanish)
- Optimizador estable ANT-ANTLION para la selección de características en datos de altadimensión
Identifiers
- Other
- https://openalex.org/W3124122716
- DOI
- 10.1049/ell2.12083
References
- https://openalex.org/W1418108976
- https://openalex.org/W1567104431
- https://openalex.org/W2001979953
- https://openalex.org/W2897301007
- https://openalex.org/W2916168844
- https://openalex.org/W2949311145
- https://openalex.org/W2955612236
- https://openalex.org/W2987343382