Published November 30, 2022 | Version v1
Publication

Analysis of Proposed and Traditional Boosting Algorithm with Standalone Classification Methods for Classifying Gene Expresssion Microarray Data Using a Reject Option

  • 1. University of Azad Jammu and Kashmir
  • 2. Shaqra University
  • 3. King Abdulaziz University
  • 4. King Khalid University
  • 5. Future University in Egypt

Description

In medical field, accurate decisions are very important as they risk human lives. decision support system (DSS) plays important role in making accurate decisions and used for classification/prediction. In gene expression analysis, genes are not only inflated by the external environmental conditions but also the expression values of certain genes are affected (like cancer, obesity etc). in this study, various traditional (Support Vector Machine, Decision Trees, and Linear Discriminant Analysis, naïve Bayes, logistic regression, and multilayer perceptron) and proposed methods (combination of traditional with ensemble and probabilistic classifiers) are used in order to perform the classification and prediction analysis. In this study we used the publicly available datasets comprised of Lymphoid, Leukemia and Colon Cancer. The classification performance on Colon dataset with traditional methods was obtained with accuracy (56%) and proposed probabilistic ensemble methods with accuracy (88%). For dataset, Leukemia, the accuracy was obtained using traditional methods (78%) and proposed methods (92%). Similarly, on Lymphoid dataset, the traditional methods yielded accuracy (75%) and proposed methods (87%). The results revealed that proposed methods yielded the improved detection performance. The proposed methods can be used as a better predictor for early diagnosis and improved diagnosis to improve the healthcare systems.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

في المجال الطبي، تعد القرارات الدقيقة مهمة للغاية لأنها تعرض حياة الإنسان للخطر. يلعب نظام دعم القرار (DSS) دورًا مهمًا في اتخاذ قرارات دقيقة ويستخدم للتصنيف/التنبؤ. في تحليل التعبير الجيني، لا تتضخم الجينات بسبب الظروف البيئية الخارجية فحسب، بل تتأثر أيضًا قيم التعبير لبعض الجينات (مثل السرطان والسمنة وما إلى ذلك). في هذه الدراسة، يتم استخدام العديد من الأساليب التقليدية (آلة ناقلات الدعم، وأشجار القرار، والتحليل التمييزي الخطي، وساذجة بايز، والانحدار اللوجستي، والإدراك متعدد الطبقات) والأساليب المقترحة (مزيج من المصنفات التقليدية مع المصنفات الجماعية والاحتمالية) من أجل إجراء تحليل التصنيف والتنبؤ. استخدمنا في هذه الدراسة مجموعات البيانات المتاحة للجمهور والمكونة من اللمفاويات وسرطان الدم وسرطان القولون. تم الحصول على أداء التصنيف على مجموعة بيانات القولون بالطرق التقليدية بدقة (56 ٪) وطرق المجموعة الاحتمالية المقترحة بدقة (88 ٪). بالنسبة لمجموعة البيانات، سرطان الدم، تم الحصول على الدقة باستخدام الطرق التقليدية (78 ٪) والطرق المقترحة (92 ٪). وبالمثل، في مجموعة البيانات اللمفاوية، أسفرت الطرق التقليدية عن دقة (75 ٪) وطرق مقترحة (87 ٪). وكشفت النتائج أن الأساليب المقترحة أسفرت عن تحسين أداء الكشف. يمكن استخدام الطرق المقترحة كمؤشر أفضل للتشخيص المبكر وتحسين التشخيص لتحسين أنظمة الرعاية الصحية.

Translated Description (French)

Dans le domaine médical, des décisions précises sont très importantes car elles risquent des vies humaines. Le système d'aide à la décision (SAD) joue un rôle important dans la prise de décisions précises et est utilisé pour la classification/prédiction. Dans l'analyse de l'expression génique, les gènes ne sont pas seulement gonflés par les conditions environnementales externes, mais aussi les valeurs d'expression de certains gènes sont affectées (comme le cancer, l'obésité, etc.). Dans cette étude, diverses méthodes traditionnelles (machine vectorielle de soutien, arbres de décision et analyse discriminante linéaire, Bayes naïve, régression logistique et perceptron multicouche) et proposées (combinaison de classificateurs traditionnels avec ensemble et probabilistes) sont utilisées afin d'effectuer la classification et l'analyse prédictive. Dans cette étude, nous avons utilisé les ensembles de données accessibles au public comprenant la lymphoïde, la leucémie et le cancer du côlon. La performance de classification sur l'ensemble de données Colon avec les méthodes traditionnelles a été obtenue avec précision (56%) et les méthodes d'ensemble probabilistes proposées avec précision (88%). Pour l'ensemble de données, Leucémie, la précision a été obtenue en utilisant des méthodes traditionnelles (78%) et des méthodes proposées (92%). De même, sur l'ensemble de données lymphoïdes, les méthodes traditionnelles ont donné une précision (75%) et les méthodes proposées (87%). Les résultats ont révélé que les méthodes proposées permettaient d'améliorer les performances de détection. Les méthodes proposées peuvent être utilisées comme un meilleur prédicteur pour un diagnostic précoce et un diagnostic amélioré pour améliorer les systèmes de santé.

Translated Description (Spanish)

En el campo de la medicina, las decisiones precisas son muy importantes, ya que ponen en riesgo vidas humanas. El sistema de apoyo a las decisiones (DSS) desempeña un papel importante en la toma de decisiones precisas y se utiliza para la clasificación/predicción. En el análisis de la expresión génica, los genes no solo están inflados por las condiciones ambientales externas, sino que también se ven afectados los valores de expresión de ciertos genes (como el cáncer, la obesidad, etc.). En este estudio, se utilizan varios métodos tradicionales (máquina de vectores de soporte, árboles de decisión y análisis discriminante lineal, Bayes ingenuo, regresión logística y perceptrón multicapa) y propuestos (combinación de clasificadores tradicionales con conjuntos y probabilísticos) para realizar la clasificación y el análisis de predicción. En este estudio utilizamos los conjuntos de datos disponibles públicamente compuestos por Linfoide, Leucemia y Cáncer de Colon. El rendimiento de la clasificación en el conjunto de datos de colon con métodos tradicionales se obtuvo con precisión (56%) y los métodos de conjunto probabilístico propuestos con precisión (88%). Para el conjunto de datos, Leucemia, la precisión se obtuvo utilizando métodos tradicionales (78%) y métodos propuestos (92%). Del mismo modo, en el conjunto de datos linfoides, los métodos tradicionales produjeron precisión (75%) y los métodos propuestos (87%). Los resultados revelaron que los métodos propuestos produjeron un mejor rendimiento de detección. Los métodos propuestos se pueden utilizar como un mejor predictor para el diagnóstico precoz y un mejor diagnóstico para mejorar los sistemas de salud.

Additional details

Additional titles

Translated title (Arabic)
تحليل خوارزمية التعزيز المقترحة والتقليدية مع طرق التصنيف المستقلة لتصنيف بيانات المصفوفة الدقيقة للتعبير الجيني باستخدام خيار الرفض
Translated title (French)
Analyse de l'algorithme d'amplification proposé et traditionnel avec des méthodes de classification autonomes pour la classification des données de microréseaux d'expression génique à l'aide d'une option de rejet
Translated title (Spanish)
Análisis del algoritmo de refuerzo propuesto y tradicional con métodos de clasificación independientes para clasificar datos de micromatrices de expresión génica utilizando una opción de rechazo

Identifiers

Other
https://openalex.org/W4310534366
DOI
10.1080/08839514.2022.2151171

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Pakistan

References

  • https://openalex.org/W1975846642
  • https://openalex.org/W1978286881
  • https://openalex.org/W1988790447
  • https://openalex.org/W2032906924
  • https://openalex.org/W2050360262
  • https://openalex.org/W2064208261
  • https://openalex.org/W2087684630
  • https://openalex.org/W2109363337
  • https://openalex.org/W2116012423
  • https://openalex.org/W2122111042
  • https://openalex.org/W2122649297
  • https://openalex.org/W2128985829
  • https://openalex.org/W2147886517
  • https://openalex.org/W2149298154
  • https://openalex.org/W2152445738
  • https://openalex.org/W2911964244