Published December 22, 2023 | Version v1
Publication Open

Performance Augmentation of Base Classifiers Using Adaptive Boosting Framework for Medical Datasets

  • 1. University of Engineering and Technology Peshawar
  • 2. Buraydah Colleges
  • 3. Qassim University

Description

This paper investigates the performance enhancement of base classifiers within the AdaBoost framework applied to medical datasets. Adaptive boosting (AdaBoost), being an instance of boosting, combines other classifiers to enhance their performance. We conducted a comprehensive experiment to assess the efficacy of twelve base classifiers with the AdaBoost framework, namely, Bayes network, decision stump, ZeroR, decision tree, Naïve Bayes, J-48, voted perceptron, random forest, bagging, random tree, stacking, and AdaBoost itself. The experiments are carried out on five datasets from the medical domain based on various types of cancers, i.e., global cancer map (GCM), lymphoma-I, lymphoma-II, leukaemia, and embryonal tumours. The evaluation focuses on the accuracy, precision, and efficiency of the base classifiers in the AdaBoost framework. The results show that the performance of Naïve Bayes, Bayes network, and voted perceptron is highly improved compared to the rest of the base classifiers, attaining accuracies as high as 94.74%, 97.78%, and 97.78%, respectively. The results also show that in most cases, the base classifiers perform better with AdaBoost compared to their performance, i.e., for voted perceptron, the accuracy is improved up to 13.34%.For bagging, it is improved by up to 7%. This research aims to identify such base classifiers with optimal boosting capabilities within the AdaBoost framework for medical datasets. The significance of these results is that they provide insight into the performance of the base classifiers when used in the boosting framework to enhance the classification performance of classifiers in scenarios where individual classifiers do not perform up to the mark.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تبحث هذه الورقة في تحسين أداء المصنفات الأساسية ضمن إطار عمل AdaBoost المطبق على مجموعات البيانات الطبية. يجمع التعزيز التكيفي (AdaBoost)، كونه مثالًا على التعزيز، بين المصنفات الأخرى لتحسين أدائها. أجرينا تجربة شاملة لتقييم فعالية اثني عشر مصنفًا أساسيًا باستخدام إطار عمل AdaBoost، وهي شبكة Bayes، وجذع القرار، و ZeroR، وشجرة القرار، و Naïve Bayes، و J -48، و perceptron المصوت، والغابات العشوائية، والتعبئة، والشجرة العشوائية، والتكديس، و AdaBoost نفسها. يتم إجراء التجارب على خمس مجموعات بيانات من المجال الطبي بناءً على أنواع مختلفة من السرطانات، أي خريطة السرطان العالمية (GCM)، وسرطان الغدد الليمفاوية I، وسرطان الغدد الليمفاوية II، وسرطان الدم، والأورام الجنينية. يركز التقييم على دقة ودقة وكفاءة المصنفات الأساسية في إطار عمل AdaBoost. تظهر النتائج أن أداء Naïve Bayes وشبكة Bayes و vote perceptron قد تحسن بشكل كبير مقارنة ببقية المصنفات الأساسية، حيث حقق دقة تصل إلى 94.74 ٪ و 97.78 ٪ و 97.78 ٪ على التوالي. تظهر النتائج أيضًا أنه في معظم الحالات، تعمل المصنفات الأساسية بشكل أفضل مع AdaBoost مقارنة بأدائها، أي بالنسبة إلى perceptron المصوت، يتم تحسين الدقة بنسبة تصل إلى 13.34 ٪. وبالنسبة للتعبئة، يتم تحسينها بنسبة تصل إلى 7 ٪. يهدف هذا البحث إلى تحديد المصنفات الأساسية ذات القدرات المعززة المثلى ضمن إطار عمل AdaBoost لمجموعات البيانات الطبية. تكمن أهمية هذه النتائج في أنها توفر نظرة ثاقبة لأداء المصنفات الأساسية عند استخدامها في إطار التعزيز لتعزيز أداء تصنيف المصنفات في السيناريوهات التي لا تؤدي فيها المصنفات الفردية ما يصل إلى العلامة.

Translated Description (French)

Cet article étudie l'amélioration des performances des classificateurs de base dans le cadre AdaBoost appliqué aux ensembles de données médicales. L'Adaptive Boost (AdaBoost), étant une instance de boosting, combine d'autres classificateurs pour améliorer leurs performances. Nous avons mené une expérience complète pour évaluer l'efficacité de douze classificateurs de base avec le cadre AdaBoost, à savoir : réseau Bayes, souche de décision, ZeroR, arbre de décision, Bayes naïfs, J-48, perceptron voté, forêt aléatoire, ensachage, arbre aléatoire, empilement et AdaBoost lui-même. Les expériences sont réalisées sur cinq ensembles de données du domaine médical basés sur divers types de cancers, à savoir la carte globale du cancer (GCM), le lymphome I, le lymphome II, la leucémie et les tumeurs embryonnaires. L'évaluation se concentre sur l'exactitude, la précision et l'efficacité des classificateurs de base dans le cadre AdaBoost. Les résultats montrent que les performances de Naïve Bayes, du réseau Bayes et du perceptron voté sont fortement améliorées par rapport au reste des classificateurs de base, atteignant des précisions allant jusqu'à 94,74 %, 97,78 % et 97,78 %, respectivement. Les résultats montrent également que dans la plupart des cas, les classificateurs de base fonctionnent mieux avec AdaBoost par rapport à leurs performances, c'est-à-dire que pour le perceptron voté, la précision est améliorée jusqu'à 13,34 %. Pour l'ensachage, elle est améliorée jusqu'à 7 %. Cette recherche vise à identifier de tels classificateurs de base avec des capacités de stimulation optimales dans le cadre AdaBoost pour les ensembles de données médicales. L'importance de ces résultats est qu'ils donnent un aperçu des performances des classificateurs de base lorsqu'ils sont utilisés dans le cadre de renforcement pour améliorer les performances de classification des classificateurs dans les scénarios où les classificateurs individuels ne fonctionnent pas à la hauteur de la note.

Translated Description (Spanish)

Este documento investiga la mejora del rendimiento de los clasificadores de base dentro del marco AdaBoost aplicado a los conjuntos de datos médicos. El boosting adaptativo (AdaBoost), al ser una instancia de boosting, combina otros clasificadores para mejorar su rendimiento. Llevamos a cabo un experimento exhaustivo para evaluar la eficacia de doce clasificadores base con el marco AdaBoost, a saber, la red Bayes, el muñón de decisión, ZeroR, el árbol de decisión, Naïve Bayes, J-48, el perceptrón votado, el bosque aleatorio, el embolsado, el árbol aleatorio, el apilamiento y el propio AdaBoost. Los experimentos se llevan a cabo en cinco conjuntos de datos del dominio médico basados en varios tipos de cánceres, es decir, mapa global del cáncer (GCM), linfoma I, linfoma II, leucemia y tumores embrionarios. La evaluación se centra en la exactitud, precisión y eficiencia de los clasificadores base en el marco AdaBoost. Los resultados muestran que el rendimiento de Naïve Bayes, la red de Bayes y el perceptrón votado mejora mucho en comparación con el resto de los clasificadores base, alcanzando precisiones de hasta el 94,74%, el 97,78% y el 97,78%, respectivamente. Los resultados también muestran que, en la mayoría de los casos, los clasificadores base funcionan mejor con AdaBoost en comparación con su rendimiento, es decir, para el perceptrón votado, la precisión mejora hasta un 13,34%. Para el embolsado, mejora hasta un 7%. Esta investigación tiene como objetivo identificar dichos clasificadores base con capacidades de impulso óptimas dentro del marco AdaBoost para conjuntos de datos médicos. La importancia de estos resultados es que proporcionan información sobre el rendimiento de los clasificadores base cuando se utilizan en el marco de refuerzo para mejorar el rendimiento de clasificación de los clasificadores en escenarios donde los clasificadores individuales no funcionan hasta la marca.

Files

5542049.pdf.pdf

Files (15.9 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:b75aabeb43d6a9d7801b1730d46f4e31
15.9 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
تعزيز أداء المصنفات الأساسية باستخدام إطار التعزيز التكيفي لمجموعات البيانات الطبية
Translated title (French)
Augmentation des performances des classificateurs de base à l'aide d'un cadre de renforcement adaptatif pour les ensembles de données médicales
Translated title (Spanish)
Aumento del rendimiento de los clasificadores base utilizando el marco de refuerzo adaptativo para conjuntos de datos médicos

Identifiers

Other
https://openalex.org/W4390095938
DOI
10.1155/2023/5542049

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Pakistan

References

  • https://openalex.org/W1555349023
  • https://openalex.org/W1557418592
  • https://openalex.org/W1570329253
  • https://openalex.org/W1817561967
  • https://openalex.org/W1987552279
  • https://openalex.org/W1987859285
  • https://openalex.org/W1988790447
  • https://openalex.org/W1991669689
  • https://openalex.org/W2020679471
  • https://openalex.org/W2059085074
  • https://openalex.org/W2138137807
  • https://openalex.org/W2149446614
  • https://openalex.org/W2169022848
  • https://openalex.org/W2181685134
  • https://openalex.org/W2236773509
  • https://openalex.org/W2751910234
  • https://openalex.org/W2792383985
  • https://openalex.org/W2894026248
  • https://openalex.org/W2953500015
  • https://openalex.org/W2954113789
  • https://openalex.org/W2981218876
  • https://openalex.org/W2988023719
  • https://openalex.org/W3017365251
  • https://openalex.org/W3039673966
  • https://openalex.org/W3136531408
  • https://openalex.org/W3200255951
  • https://openalex.org/W38301456
  • https://openalex.org/W4242380336
  • https://openalex.org/W4249572517
  • https://openalex.org/W4302416903