Bond-Extended Stochastic and Non-Stochastic Bilinear Indices. 1. QSPR/QSAR Applications to the Description of Properties/Activities of Small-Medium Size Organic Compounds
Creators
- 1. Parc Científic de la Universitat de València
- 2. Central University of Las Villas
- 3. Universitat de València
Description
Bond-extended stochastic and non-stochastic bilinear indices are introduced in this paper as novel bond-level molecular descriptors (MDs). These novel totals (wholemolecule) MDs are based on a bilinear maps (forms) similar to use defined in linear algebra. The proposed non-stochastic indices try to match molecular structure provided by the molecular topology by using the kth Edge(Bond)-Adjacency Matrix (Ek, designed here as non-stochastic E matrix). The stochastic parameters are computed by using the kth stochastic edge-adjacency matrix, ESk, as matrix operators of bilinear transformations. This new edge (bond)-adjacency relationships can be obtained directly from Ek and can be consider like a new matrix-transformation strategic to obtain new relation for a molecular graph. In both set of MDs, chemical information is codified by using different pair combinations of atomic weightings (in this case four atomic-labels: atomic mass, polarizability, van der Waals volume, and electronegativity). In addition, a local-fragment (bond-type) formalism was also developed. The kth bond-type bilinear indices are calculated by summing the kth bond bilinear indices of all bonds of the same bond type in the molecules. The new set of MDs can be easily and quickly calculate in our in house software TOMOCOMD-CARDD (TOpological MOlecular COMputer Design Computer-Aided –Rational– Drug Design). The reported application and utilization of these MDs for predictive capability correlations of structure with physicochemical and pharmacology properties are reviewed. Three benchmark datasets have been used to evaluate the QSPR/QSAR behavior of the new bond-level TOMOCOMD-CARDD MDs. We developed the QSPR models to describe several physicochemical properties of octane isomers (FIRST CASE) and, to analyze of the boiling point of 28 alkyl-alcohols (SECOND CASE) and to examine of the specific rate constant (log k), the partition coefficient (log P), as well as the antibacterial activity of 34 derivatives of 2-furylethylenes (THIRD CASE). For these three rounds, the quantitative models found are significant from a statistical point of view and permit a clear interpretation of the studied properties in terms of the structural features of molecules. A leave-out-out cross-validation procedure revealed that the regression models had a good predictability. The comparison with other approaches reveals good performance of the method proposed. Therefore, it is clearly demonstrated that this suitability is higher than that shown by other 2D/3D well-known sets of MDs. The approach described here appears to be a very promising structural invariant, useful for QSPR/QSAR studies and shown to provide an excellent alternative or guides for discovery and optimization of new lead compounds, reducing the time and cost of traditional procedure.
Translated Descriptions
Translated Description (Arabic)
يتم تقديم المؤشرات العشوائية الموسعة وغير العشوائية ثنائية الخط في هذه الورقة باعتبارها واصفات جزيئية جديدة على مستوى الرابطة (MDs). تعتمد هذه المجاميع الجديدة (جزيء كامل) MDs على خرائط (نماذج) ثنائية الخطية مماثلة للاستخدام المحدد في الجبر الخطي. تحاول المؤشرات غير العشوائية المقترحة مطابقة التركيب الجزيئي الذي توفره الطوبولوجيا الجزيئية باستخدام مصفوفة kth Edge(Bond) - Adjacency (EK، المصممة هنا كمصفوفة E غير عشوائية). يتم حساب المعلمات العشوائية باستخدام مصفوفة تجاور الحافة العشوائية kth، ESk، كمشغلات مصفوفة للتحولات ثنائية الخط. يمكن الحصول على هذه العلاقات الجديدة بين الحافة (الرابطة) والجاذبية مباشرة من EK ويمكن اعتبارها استراتيجية تحويل مصفوفة جديدة للحصول على علاقة جديدة للرسم البياني الجزيئي. في كلتا المجموعتين من MDs، يتم ترميز المعلومات الكيميائية باستخدام مجموعات زوجية مختلفة من الأوزان الذرية (في هذه الحالة أربع علامات ذرية: الكتلة الذرية، الاستقطاب، حجم فان دير فالس، والسلبية الكهربائية). بالإضافة إلى ذلك، تم أيضًا تطوير شكلية تجزئة محلية (من نوع السندات). يتم حساب المؤشرات الثنائية الخطية من نوع الرابطة kth عن طريق جمع المؤشرات الثنائية الخطية من نوع الرابطة kth لجميع الروابط من نفس نوع الرابطة في الجزيئات. يمكن حساب المجموعة الجديدة من MDs بسهولة وسرعة في برنامجنا الداخلي TOMOCOMD - CARDD (TOPOLOGICAL MOlecular COMputer Design Computer - Rational - Drug Design). تتم مراجعة التطبيق والاستخدام المبلغ عنه لهذه MDs لارتباطات القدرة التنبؤية للهيكل مع الخصائص الفيزيائية والكيميائية والصيدلانية. تم استخدام ثلاث مجموعات بيانات مرجعية لتقييم سلوك QSPR/QSAR لأطباء TOMOCOMD - CARDD الجدد على مستوى السندات. طورنا نماذج QSPR لوصف العديد من الخصائص الفيزيائية الكيميائية لأيزومرات الأوكتان (الحالة الأولى)، ولتحليل نقطة غليان 28 كحول ألكيل (الحالة الثانية) وفحص ثابت المعدل المحدد (log k)، ومعامل التقسيم (log P)، وكذلك النشاط المضاد للبكتيريا لـ 34 مشتقًا من 2 -فوريل إيثيلين (الحالة الثالثة). بالنسبة لهذه الجولات الثلاث، فإن النماذج الكمية الموجودة مهمة من وجهة نظر إحصائية وتسمح بتفسير واضح للخصائص المدروسة من حيث السمات الهيكلية للجزيئات. كشف إجراء التحقق المتبادل المستبعد أن نماذج الانحدار تتمتع بإمكانية جيدة للتنبؤ. تكشف المقارنة مع الأساليب الأخرى عن الأداء الجيد للطريقة المقترحة. لذلك، يتضح بوضوح أن هذه الملاءمة أعلى من تلك التي تظهرها مجموعات أخرى ثنائية الأبعاد/ثلاثية الأبعاد معروفة من MDs. يبدو أن النهج الموصوف هنا هو ثابت هيكلي واعد للغاية، ومفيد لدراسات QSPR/QSAR ويظهر أنه يوفر بديلاً ممتازًا أو أدلة لاكتشاف وتحسين مركبات الرصاص الجديدة، مما يقلل من وقت وتكلفة الإجراء التقليدي.Translated Description (French)
Les indices bilinéaires stochastiques et non stochastiques étendus aux liaisons sont introduits dans cet article en tant que nouveaux descripteurs moléculaires au niveau des liaisons (MD). Ces nouveaux MD totaux (entiersmoléculaires) sont basés sur une cartographie bilinéaire (formes) similaire à l'utilisation définie en algèbre linéaire. Les indices non stochastiques proposés tentent de faire correspondre la structure moléculaire fournie par la topologie moléculaire en utilisant la matrice kth Edge(Bond) -Adjacency (Ek, conçue ici comme matrice E non stochastique). Les paramètres stochastiques sont calculés en utilisant la matrice de contiguïté de bord stochastique kth, ESk, en tant qu'opérateurs matriciels de transformations bilinéaires. Cette nouvelle relation bord (lien)-adjacence peut être obtenue directement auprès de Ek et peut être considérée comme une nouvelle stratégie de transformation de matrice pour obtenir une nouvelle relation pour un graphe moléculaire. Dans les deux ensembles de DM, les informations chimiques sont codifiées en utilisant différentes combinaisons de paires de pondérations atomiques (dans ce cas, quatre étiquettes atomiques : masse atomique, polarisabilité, volume de van der Waals et électronégativité). En outre, un formalisme de fragment local (type obligation) a également été développé. Les indices bilinéaires de type k-ième liaison sont calculés en additionnant les indices bilinéaires de type k-ième liaison de toutes les liaisons du même type de liaison dans les molécules. Le nouvel ensemble de DM peut être facilement et rapidement calculé dans notre logiciel interne TOMOCOMD-CARDD (TOpological MOlecular COMputer Design Computer-Aided –Rational– Drug Design). L'application et l'utilisation rapportées de ces DM pour les corrélations de capacité prédictive de la structure avec les propriétés physicochimiques et pharmacologiques sont examinées. Trois ensembles de données de référence ont été utilisés pour évaluer le comportement QSPR/QSAR des nouveaux MD TOMOCOMD-CARDD au niveau des obligations. Nous avons développé les modèles QSPR pour décrire plusieurs propriétés physico-chimiques des isomères de l'octane (PREMIER CAS) et, pour analyser le point d'ébullition de 28 alkyl-alcools (DEUXIÈME CAS) et examiner la constante de vitesse spécifique (log k), le coefficient de partage (log P), ainsi que l'activité antibactérienne de 34 dérivés de 2-furyléthylènes (TROISIÈME CAS). Pour ces trois tours, les modèles quantitatifs trouvés sont significatifs d'un point de vue statistique et permettent une interprétation claire des propriétés étudiées en termes de caractéristiques structurelles des molécules. Une procédure de validation croisée sans exclusion a révélé que les modèles de régression avaient une bonne prévisibilité. La comparaison avec d'autres approches révèle de bonnes performances de la méthode proposée. Par conséquent, il est clairement démontré que cette adéquation est supérieure à celle démontrée par d'autres ensembles de DM bien connus en 2D/3D. L'approche décrite ici semble être un invariant structurel très prometteur, utile pour les études QSPR/QSAR et montré pour fournir une excellente alternative ou des guides pour la découverte et l'optimisation de nouveaux composés de plomb, réduisant le temps et le coût de la procédure traditionnelle.Translated Description (Spanish)
Los índices bilineales estocásticos y no estocásticos extendidos por enlaces se introducen en este documento como nuevos descriptores moleculares (MD) a nivel de enlace. Estos nuevos totales (molécula completa) MD se basan en mapas bilineales (formas) similares al uso definido en álgebra lineal. Los índices no estocásticos propuestos intentan coincidir con la estructura molecular proporcionada por la topología molecular utilizando la matriz kth Edge(Bond) -Adjacency (Ek, diseñada aquí como matriz E no estocástica). Los parámetros estocásticos se calculan utilizando la késima matriz estocástica de adyacencia de bordes, ESk, como operadores de matriz de transformaciones bilineales. Esta nueva relación borde (enlace)-adyacencia se puede obtener directamente de Ek y se puede considerar como una nueva estrategia de transformación de matriz para obtener una nueva relación para un gráfico molecular. En ambos conjuntos de MD, la información química se codifica mediante el uso de diferentes combinaciones de pares de ponderaciones atómicas (en este caso, cuatro etiquetas atómicas: masa atómica, polarizabilidad, volumen de van der Waals y electronegatividad). Además, también se desarrolló un formalismo de fragmento local (tipo enlace). Los índices bilineales de enlace k-ésimo se calculan sumando los índices bilineales de enlace k-ésimo de todos los enlaces del mismo tipo de enlace en las moléculas. El nuevo conjunto de MD se puede calcular fácil y rápidamente en nuestro software interno TOMOCOMD-CARDD (TOpological MOlecular COMputer Design Computer-Aided –Rational– Drug Design). Se revisa la aplicación y utilización informadas de estos MD para las correlaciones de capacidad predictiva de la estructura con las propiedades fisicoquímicas y farmacológicas. Se han utilizado tres conjuntos de datos de referencia para evaluar el comportamiento QSPR/QSAR de los nuevos MD de TOMOCOMD-CARDD a nivel de bonos. Desarrollamos los modelos QSPR para describir varias propiedades fisicoquímicas de los isómeros de octano (PRIMER CASO) y, para analizar el punto de ebullición de 28 alquil-alcoholes (SEGUNDO CASO) y para examinar la constante de velocidad específica (log k), el coeficiente de partición (log P), así como la actividad antibacteriana de 34 derivados de 2-furiletilenos (TERCER CASO). Para estas tres rondas, los modelos cuantitativos encontrados son significativos desde un punto de vista estadístico y permiten una interpretación clara de las propiedades estudiadas en términos de las características estructurales de las moléculas. Un procedimiento de validación cruzada de exclusión reveló que los modelos de regresión tenían una buena predictibilidad. La comparación con otros enfoques revela un buen rendimiento del método propuesto. Por lo tanto, se demuestra claramente que esta idoneidad es mayor que la mostrada por otros conjuntos de MD bien conocidos en 2D/3D. El enfoque descrito aquí parece ser una invariante estructural muy prometedora, útil para los estudios de QSPR/QSAR y se ha demostrado que proporciona una excelente alternativa o guías para el descubrimiento y optimización de nuevos compuestos de plomo, reduciendo el tiempo y el costo del procedimiento tradicional.Additional details
Additional titles
- Translated title (Arabic)
- مؤشرات الاستوكاستك الموسعة وغير المتقطعة ثنائية الخط. 1. تطبيقات QSPR/QSAR لوصف خصائص/أنشطة المركبات العضوية صغيرة ومتوسطة الحجم
- Translated title (French)
- Indices bilinéaires stochastiques et non stochastiques étendus par obligation. 1. Applications QSPR/QSAR à la description des propriétés/activités des composés organiques de petite et moyenne taille
- Translated title (Spanish)
- Índices bilineales estocásticos y no estocásticos extendidos por bonos. 1. Aplicaciones de QSPR/QSAR a la descripción de propiedades/actividades de compuestos orgánicos de tamaño pequeño y mediano
Identifiers
- Other
- https://openalex.org/W2920865101
- DOI
- 10.3390/ecsoc-12-01280