Published March 16, 2018 | Version v1
Publication Open

<strong>New tool useful for drug discovery validated through benchmark datasets</strong>

  • 1. Carleton University
  • 2. University of Camagüey
  • 3. Universidade Federal de Lavras
  • 4. Universidad Tecnológica de Bolívar
  • 5. Parc Científic de la Universitat de València

Description

Atomic Weighted Vectors (AWVs) are vectors that contain the codified information of molecular structures, which can apply to a set of Aggregation Operators (AOs) to calculate total and local molecular descriptors (MDs). This article presents an exploratory study of a new tool useful for drug discovery using different datasets, such as DRAGON and Sutherland's datasets, as well as their comparison with other well-known approaches. In order to evaluate the performance of the tool, several statistics and QSAR/QSPR experiments were performed. Variability analyses are used to quantify the information content of the AWVs obtained from the tool, by the way of an information theory-based algorithm. Principal Components Analysis (PCA) is used to analyze the orthogonality of these descriptors, for which the new MDs from AWVs provide different information from those codified by DRAGON descriptors (0-2D). The QSAR models are obtained for every Sutherland's dataset, according to the original division into training/test sets, by means of the Multiple Linear Regression with Genetic Algorithm (MLR-GA). These models have been validated and compare favorably to several approaches previously published, using the same benchmark datasets. The obtained results show that this tool should be a useful strategy for the QSAR/QSPR studies, despite its simplicity.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

المتجهات الذرية المرجحة (AWVs) هي متجهات تحتوي على المعلومات المقننة للهياكل الجزيئية، والتي يمكن تطبيقها على مجموعة من مشغلي التجميع (AOs) لحساب الواصفات الجزيئية الإجمالية والمحلية (MDs). تقدم هذه المقالة دراسة استكشافية لأداة جديدة مفيدة لاكتشاف الأدوية باستخدام مجموعات بيانات مختلفة، مثل مجموعات بيانات DRAGON و Sutherland، بالإضافة إلى مقارنتها بالنهج الأخرى المعروفة. من أجل تقييم أداء الأداة، تم إجراء العديد من الإحصائيات وتجارب QSAR/QSPR. تُستخدم تحليلات التباين لتحديد محتوى معلومات AWVs التي تم الحصول عليها من الأداة، عن طريق خوارزمية قائمة على نظرية المعلومات. يتم استخدام تحليل المكونات الرئيسية (PCA) لتحليل عمودية هذه الواصفات، والتي توفر لها MDs الجديدة من AWVs معلومات مختلفة عن تلك التي تم تدوينها بواسطة واصفات DRAGON (0-2 D). يتم الحصول على نماذج QSAR لكل مجموعة بيانات Sutherland، وفقًا للتقسيم الأصلي إلى مجموعات التدريب/الاختبار، عن طريق الانحدار الخطي المتعدد مع الخوارزمية الجينية (MLR - GA). تم التحقق من صحة هذه النماذج ومقارنتها بشكل إيجابي بالعديد من الأساليب المنشورة سابقًا، باستخدام نفس مجموعات البيانات المعيارية. تظهر النتائج التي تم الحصول عليها أن هذه الأداة يجب أن تكون استراتيجية مفيدة لدراسات QSAR/QSPR، على الرغم من بساطتها.

Translated Description (French)

Les vecteurs pondérés atomiques (AWV) sont des vecteurs qui contiennent les informations codifiées des structures moléculaires, qui peuvent s'appliquer à un ensemble d'opérateurs d'agrégation (AO) pour calculer les descripteurs moléculaires totaux et locaux (MD). Cet article présente une étude exploratoire d'un nouvel outil utile pour la découverte de médicaments à l'aide de différents ensembles de données, tels que les ensembles de données de DRAGON et de Sutherland, ainsi que leur comparaison avec d'autres approches bien connues. Afin d'évaluer les performances de l'outil, plusieurs statistiques et expériences QSAR/QSPR ont été réalisées. Les analyses de variabilité sont utilisées pour quantifier le contenu informationnel des VAE obtenues à partir de l'outil, au moyen d'un algorithme basé sur la théorie de l'information. L'analyse en composantes principales (ACP) est utilisée pour analyser l'orthogonalité de ces descripteurs, pour lesquels les nouveaux DM des AWV fournissent des informations différentes de celles codifiées par les descripteurs DRAGON (0-2D). Les modèles QSAR sont obtenus pour chaque ensemble de données de Sutherland, selon la division originale en ensembles d'entraînement/test, au moyen de la régression linéaire multiple avec algorithme génétique (MLR-GA). Ces modèles ont été validés et comparés favorablement à plusieurs approches précédemment publiées, utilisant les mêmes ensembles de données de référence. Les résultats obtenus montrent que cet outil devrait être une stratégie utile pour les études QSAR/QSPR, malgré sa simplicité.

Translated Description (Spanish)

Los vectores ponderados atómicos (AWV) son vectores que contienen la información codificada de estructuras moleculares, que pueden aplicarse a un conjunto de operadores de agregación (AO) para calcular descriptores moleculares (MD) totales y locales. Este artículo presenta un estudio exploratorio de una nueva herramienta útil para el descubrimiento de fármacos utilizando diferentes conjuntos de datos, como los conjuntos de datos de DRAGON y Sutherland, así como su comparación con otros enfoques bien conocidos. Para evaluar el rendimiento de la herramienta, se realizaron varias estadísticas y experimentos QSAR/QSPR. Los análisis de variabilidad se utilizan para cuantificar el contenido de información de los AWV obtenidos de la herramienta, mediante un algoritmo basado en la teoría de la información. El Análisis de Componentes Principales (PCA) se utiliza para analizar la ortogonalidad de estos descriptores, para lo cual los nuevos MD de AWV proporcionan información diferente a las codificadas por los descriptores DRAGON (0-2D). Los modelos QSAR se obtienen para cada conjunto de datos de Sutherland, de acuerdo con la división original en conjuntos de entrenamiento/prueba, mediante la Regresión Lineal Múltiple con Algoritmo Genético (MLR-GA). Estos modelos han sido validados y se comparan favorablemente con varios enfoques publicados anteriormente, utilizando los mismos conjuntos de datos de referencia. Los resultados obtenidos muestran que esta herramienta debería ser una estrategia útil para los estudios QSAR/QSPR, a pesar de su simplicidad.

Files

presentation.pdf

Files (76.9 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:ba7b5d2b6a055d825f1dea78beca4c0c
76.9 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
<strong> أداة جديدة مفيدة لاكتشاف الأدوية تم التحقق من صحتها من خلال مجموعات البيانات المعيارية </ strong>
Translated title (French)
<strong>Nouvel outil utile pour la découverte de médicaments validé par des ensembles de données de référence </strong>
Translated title (Spanish)
<strong>Nueva herramienta útil para el descubrimiento de fármacos validada a través de conjuntos de datos de referencia </strong>

Identifiers

Other
https://openalex.org/W2789801724
DOI
10.3390/mol2net-04-05132

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Cuba