Published May 10, 2023 | Version v1
Publication Open

Weighted scaling approach for metabolomics data analysis

  • 1. University of Rajshahi
  • 2. Bangabandhu Sheikh Mujibur Rahman Science and Technology University
  • 3. Ochsner Health System

Description

Systematic variation is a common issue in metabolomics data analysis. Therefore, different scaling and normalization techniques are used to preprocess the data for metabolomics data analysis. Although several scaling methods are available in the literature, however, choice of scaling, transformation and/or normalization technique influences the further statistical analysis. It is challenged to choose the appropriate scaling technique for downstream analysis to get accurate results or to make proper decision. Moreover, the existing scaling techniques are sensitive to outliers or extreme values. To fill the gap, our objective is to introduce a robust scaling approach that is not influenced by outliers as well as provides more accurate results for downstream analysis. Here, we introduced a new weighted scaling approach that is robust against outliers; however, no additional outlier detection/treatment step is needed in data preprocessing and also compared it with the conventional scaling and normalization techniques through artificial and real metabolomics datasets. We evaluated the performance of the proposed method in comparison to the other existing conventional scaling techniques using metabolomics data analysis in both the absence and presence of different percentages of outliers. Results show that in most cases, the proposed scaling technique is a better performer than the traditional scaling methods in both the absence and presence of outliers. The proposed method improves the further downstream metabolomics analysis. The R function of the proposed robust scaling method is available at https://github.com/nishithkumarpaul/robustScaling/blob/main/wscaling.R

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

التباين المنهجي هو مشكلة شائعة في تحليل بيانات الأيض. لذلك، يتم استخدام تقنيات القياس والتطبيع المختلفة لمعالجة البيانات مسبقًا لتحليل بيانات الأيض. على الرغم من توفر العديد من طرق القياس في الأدبيات، إلا أن اختيار تقنية القياس والتحول و/أو التطبيع يؤثر على التحليل الإحصائي الإضافي. يتم تحدي اختيار تقنية القياس المناسبة للتحليل النهائي للحصول على نتائج دقيقة أو لاتخاذ القرار المناسب. علاوة على ذلك، فإن تقنيات القياس الحالية حساسة للقيم المتطرفة أو القيم المتطرفة. لسد الفجوة، يتمثل هدفنا في تقديم نهج قوي للتوسع لا يتأثر بالقيم المتطرفة بالإضافة إلى توفير نتائج أكثر دقة للتحليل النهائي. هنا، قدمنا نهج قياس مرجحًا جديدًا قويًا ضد القيم المتطرفة ؛ ومع ذلك، لا توجد حاجة إلى خطوة إضافية للكشف/المعالجة المتطرفة في معالجة البيانات مسبقًا وقارناها أيضًا بتقنيات القياس والتطبيع التقليدية من خلال مجموعات بيانات الأيض الاصطناعية والحقيقية. قمنا بتقييم أداء الطريقة المقترحة مقارنة بتقنيات القياس التقليدية الأخرى الموجودة باستخدام تحليل بيانات الأيض في غياب ووجود نسب مئوية مختلفة من القيم المتطرفة. تظهر النتائج أنه في معظم الحالات، تكون تقنية القياس المقترحة أفضل أداءً من طرق القياس التقليدية في غياب ووجود القيم المتطرفة. تعمل الطريقة المقترحة على تحسين تحليل الأيض النهائي. تتوفر وظيفة R لطريقة القياس القوية المقترحة على https://github.com/nishithkumarpaul/robustScaling/blob/main/wscaling.R

Translated Description (French)

La variation systématique est un problème courant dans l'analyse des données métabolomiques. Par conséquent, différentes techniques de mise à l'échelle et de normalisation sont utilisées pour prétraiter les données pour l'analyse des données métabolomiques. Bien que plusieurs méthodes de mise à l'échelle soient disponibles dans la littérature, cependant, le choix de la technique de mise à l'échelle, de transformation et/ou de normalisation influence la poursuite de l'analyse statistique. Il est difficile de choisir la technique de mise à l'échelle appropriée pour l'analyse en aval afin d'obtenir des résultats précis ou de prendre la bonne décision. De plus, les techniques de mise à l'échelle existantes sont sensibles aux valeurs aberrantes ou extrêmes. Pour combler cette lacune, notre objectif est d'introduire une approche de mise à l'échelle robuste qui n'est pas influencée par les valeurs aberrantes et qui fournit des résultats plus précis pour l'analyse en aval. Ici, nous avons introduit une nouvelle approche de mise à l'échelle pondérée qui est robuste contre les valeurs aberrantes ; cependant, aucune étape supplémentaire de détection/traitement des valeurs aberrantes n'est nécessaire dans le prétraitement des données et nous l'avons également comparée aux techniques conventionnelles de mise à l'échelle et de normalisation grâce à des ensembles de données métabolomiques artificielles et réelles. Nous avons évalué la performance de la méthode proposée par rapport aux autres techniques de mise à l'échelle conventionnelles existantes en utilisant l'analyse des données métabolomiques en l'absence et en présence de différents pourcentages de valeurs aberrantes. Les résultats montrent que dans la plupart des cas, la technique de mise à l'échelle proposée est plus performante que les méthodes de mise à l'échelle traditionnelles en l'absence et en présence de valeurs aberrantes. La méthode proposée améliore l'analyse métabolomique en aval. La fonction R de la méthode de mise à l'échelle robuste proposée est disponible sur https://github.com/nishithkumarpaul/robustScaling/blob/main/wscaling.R

Translated Description (Spanish)

La variación sistemática es un problema común en el análisis de datos metabolómicos. Por lo tanto, se utilizan diferentes técnicas de escalado y normalización para preprocesar los datos para el análisis de datos metabolómicos. Aunque hay varios métodos de escalado disponibles en la literatura, sin embargo, la elección de la técnica de escalado, transformación y/o normalización influye en el análisis estadístico adicional. Se enfrenta al desafío de elegir la técnica de escalado adecuada para el análisis posterior a fin de obtener resultados precisos o tomar una decisión adecuada. Además, las técnicas de escalado existentes son sensibles a valores atípicos o extremos. Para llenar el vacío, nuestro objetivo es introducir un enfoque de escala robusto que no esté influenciado por valores atípicos y que proporcione resultados más precisos para el análisis posterior. Aquí, introdujimos un nuevo enfoque de escala ponderada que es sólido frente a los valores atípicos; sin embargo, no se necesita un paso adicional de detección/tratamiento de valores atípicos en el preprocesamiento de datos y también lo comparamos con las técnicas convencionales de escala y normalización a través de conjuntos de datos metabolómicos artificiales y reales. Evaluamos el rendimiento del método propuesto en comparación con las otras técnicas de escalado convencionales existentes utilizando el análisis de datos metabolómicos tanto en ausencia como en presencia de diferentes porcentajes de valores atípicos. Los resultados muestran que, en la mayoría de los casos, la técnica de escalado propuesta tiene un mejor rendimiento que los métodos de escalado tradicionales tanto en ausencia como en presencia de valores atípicos. El método propuesto mejora el análisis metabolómico posterior. La función R del método de escala robusta propuesto está disponible en https://github.com/nishithkumarpaul/robustScaling/blob/main/wscaling.R

Files

latest.pdf.pdf

Files (830.4 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:105b81d0f644494989b8617a4ba6e10c
830.4 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
نهج القياس المرجح لتحليل بيانات الأيض
Translated title (French)
Approche de mise à l'échelle pondérée pour l'analyse des données métabolomiques
Translated title (Spanish)
Enfoque de escala ponderada para el análisis de datos metabolómicos

Identifiers

Other
https://openalex.org/W4376138127
DOI
10.1007/s42081-023-00205-2

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Bangladesh

References

  • https://openalex.org/W1611854178
  • https://openalex.org/W166944394
  • https://openalex.org/W1879997190
  • https://openalex.org/W1973289186
  • https://openalex.org/W1973710393
  • https://openalex.org/W1985342813
  • https://openalex.org/W1999479032
  • https://openalex.org/W2002242662
  • https://openalex.org/W2016327788
  • https://openalex.org/W2024163331
  • https://openalex.org/W2036491364
  • https://openalex.org/W2082043420
  • https://openalex.org/W2085946009
  • https://openalex.org/W2097778810
  • https://openalex.org/W2106230701
  • https://openalex.org/W2114390083
  • https://openalex.org/W2123033128
  • https://openalex.org/W2124911115
  • https://openalex.org/W2139381960
  • https://openalex.org/W2141906090
  • https://openalex.org/W2160633228
  • https://openalex.org/W2165637943
  • https://openalex.org/W2527514331
  • https://openalex.org/W2565482980
  • https://openalex.org/W2588598477
  • https://openalex.org/W2594895839
  • https://openalex.org/W2741167775
  • https://openalex.org/W2765476131
  • https://openalex.org/W2790412731
  • https://openalex.org/W2795269803
  • https://openalex.org/W2795774839
  • https://openalex.org/W2807118883
  • https://openalex.org/W2888241344
  • https://openalex.org/W2903257613
  • https://openalex.org/W2991400521
  • https://openalex.org/W3008339493
  • https://openalex.org/W3010754836
  • https://openalex.org/W3033627038
  • https://openalex.org/W3039689133
  • https://openalex.org/W3081423005
  • https://openalex.org/W3110924479
  • https://openalex.org/W3164708448
  • https://openalex.org/W3182244054
  • https://openalex.org/W3198646144
  • https://openalex.org/W4210650638
  • https://openalex.org/W4225146076
  • https://openalex.org/W4388683794