Published March 25, 2024 | Version v1
Publication Open

Prospective virtual screening combined with bio-molecular simulation enabled identification of new inhibitors for the KRAS drug target

  • 1. Abdul Wali Khan University Mardan
  • 2. Jeddah University
  • 3. Prince Sattam Bin Abdulaziz University
  • 4. Jazan University
  • 5. Umm al-Qura University
  • 6. Shaqra University

Description

Abstract Lung cancer is a disease with a high mortality rate and it is the number one cause of cancer death globally. Approximately 12–14% of non-small cell lung cancers are caused by mutations in KRAS G12C . The KRAS G12C is one of the most prevalent mutants in lung cancer patients. KRAS was first considered undruggable. The sotorasib and adagrasib are the recently approved drugs that selectively target KRAS G12C , and offer new treatment approaches to enhance patient outcomes however drug resistance frequently arises. Drug development is a challenging, expensive, and time-consuming process. Recently, machine-learning-based virtual screening are used for the development of new drugs. In this study, we performed machine-learning-based virtual screening followed by molecular docking, all atoms molecular dynamics simulation, and binding energy calculations for the identifications of new inhibitors against the KRAS G12C mutant. In this study, four machine learning models including, random forest, k-nearest neighbors, Gaussian naïve Bayes, and support vector machine were used. By using an external dataset and 5-fold cross-validation, the developed models were validated. Among all the models the performance of the random forest (RF) model was best on the train/test dataset and external dataset. The random forest model was further used for the virtual screening of the ZINC15 database, in-house database, Pakistani phytochemicals, and South African Natural Products database. A total of 100 ns MD simulation was performed for the four best docking score complexes as well as the standard compound in complex with KRAS G12C . Furthermore, the top four hits revealed greater stability and greater binding affinities for KRAS G12C compared to the standard drug. These new hits have the potential to inhibit KRAS G12C and may help to prevent KRAS-associated lung cancer. All the datasets used in this study can be freely available at ( https://github.com/Amar-Ajmal/Datasets-for-KRAS ).

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

ملخص سرطان الرئة هو مرض ذو معدل وفيات مرتفع وهو السبب الأول للوفاة بالسرطان على مستوى العالم. ما يقرب من 12-14 ٪ من سرطانات الرئة ذات الخلايا غير الصغيرة ناتجة عن طفرات في KRAS G12C . يعد KRAS G12C أحد أكثر الطفرات انتشارًا في مرضى سرطان الرئة. تم اعتبار KRAS لأول مرة غير قابل للإتلاف. و sotorasib و adagrasib هي الأدوية التي تمت الموافقة عليها مؤخرًا والتي تستهدف بشكل انتقائي KRAS G12C، وتقدم أساليب علاجية جديدة لتعزيز نتائج المرضى ولكن مقاومة الأدوية تنشأ في كثير من الأحيان. يعد تطوير الأدوية عملية صعبة ومكلفة وتستغرق وقتًا طويلاً. في الآونة الأخيرة، يتم استخدام الفحص الافتراضي القائم على التعلم الآلي لتطوير أدوية جديدة. في هذه الدراسة، أجرينا فحصًا افتراضيًا قائمًا على التعلم الآلي متبوعًا بالالتحام الجزيئي، ومحاكاة الديناميكيات الجزيئية لجميع الذرات، وحسابات طاقة الربط لتحديد المثبطات الجديدة ضد طفرة KRAS G12C. في هذه الدراسة، تم استخدام أربعة نماذج للتعلم الآلي بما في ذلك، الغابة العشوائية، وأقرب جيران k، و Gaussian naïve Bayes، وآلة ناقلات الدعم. باستخدام مجموعة بيانات خارجية والتحقق المتبادل 5 أضعاف، تم التحقق من صحة النماذج المطورة. من بين جميع النماذج، كان أداء نموذج الغابة العشوائية (RF) أفضل في مجموعة بيانات القطار/الاختبار ومجموعة البيانات الخارجية. كما تم استخدام نموذج الغابات العشوائية للفحص الافتراضي لقاعدة بيانات ZINC15، وقاعدة البيانات الداخلية، والمواد الكيميائية النباتية الباكستانية، وقاعدة بيانات المنتجات الطبيعية في جنوب إفريقيا. تم إجراء ما مجموعه 100 نانو ثانية من محاكاة MD لأفضل أربعة مجمعات لرسو السفن بالإضافة إلى المركب القياسي في المجمع مع KRAS G12C . علاوة على ذلك، كشفت الضربات الأربع الأولى عن استقرار أكبر وانتماءات ربط أكبر لـ KRAS G12C مقارنة بالعقار القياسي. هذه الإصابات الجديدة لديها القدرة على تثبيط KRAS G12C وقد تساعد في الوقاية من سرطان الرئة المرتبط بـ KRAS. يمكن أن تكون جميع مجموعات البيانات المستخدمة في هذه الدراسة متاحة مجانًا على ( https://github.com/Amar-Ajmal/Datasets-for-KRAS ).

Translated Description (French)

Résumé Le cancer du poumon est une maladie avec un taux de mortalité élevé et c'est la première cause de décès par cancer dans le monde. Environ 12 à 14 % des cancers du poumon non à petites cellules sont causés par des mutations de KRAS G12C . Le KRAS G12C est l'un des mutants les plus répandus chez les patients atteints de cancer du poumon. KRAS a d'abord été considéré comme non médicamenteux. Le sotorasib et l'adagrasib sont les médicaments récemment approuvés qui ciblent sélectivement KRAS G12C et offrent de nouvelles approches de traitement pour améliorer les résultats pour les patients, mais la pharmacorésistance survient fréquemment. Le développement de médicaments est un processus difficile, coûteux et long. Récemment, le dépistage virtuel basé sur l'apprentissage automatique est utilisé pour le développement de nouveaux médicaments. Dans cette étude, nous avons effectué un criblage virtuel basé sur l'apprentissage automatique suivi d'un amarrage moléculaire, d'une simulation de la dynamique moléculaire de tous les atomes et de calculs de l'énergie de liaison pour l'identification de nouveaux inhibiteurs contre le mutant KRAS G12C. Dans cette étude, quatre modèles d'apprentissage automatique ont été utilisés : forêt aléatoire, k voisins les plus proches, Bayes naïf gaussien et machine à vecteur de support. En utilisant un ensemble de données externes et une validation croisée 5 fois, les modèles développés ont été validés. Parmi tous les modèles, la performance du modèle de forêt aléatoire (RF) était la meilleure sur l'ensemble de données de train/test et l'ensemble de données externes. Le modèle de forêt aléatoire a également été utilisé pour le dépistage virtuel de la base de données ZINC15, de la base de données interne, des produits phytochimiques pakistanais et de la base de données des produits naturels sud-africains. Un total de 100 ns de simulation MD a été effectué pour les quatre meilleurs complexes de score d'amarrage ainsi que le composé standard en complexe avec KRAS G12C . De plus, les quatre premiers résultats ont révélé une plus grande stabilité et de plus grandes affinités de liaison pour KRAS G12C par rapport au médicament standard. Ces nouveaux hits ont le potentiel d'inhiber KRAS G12C et peuvent aider à prévenir le cancer du poumon associé à KRAS. Tous les ensembles de données utilisés dans cette étude peuvent être consultés gratuitement sur ( https://github.com/Amar-Ajmal/Datasets-for-KRAS ).

Translated Description (Spanish)

Resumen El cáncer de pulmón es una enfermedad con una alta tasa de mortalidad y es la causa número uno de muerte por cáncer a nivel mundial. Aproximadamente el 12–14% de los cánceres de pulmón de células no pequeñas son causados por mutaciones en KRAS G12C . El KRAS G12C es uno de los mutantes más prevalentes en pacientes con cáncer de pulmón. El KRAS se consideró en un principio insoportable. El sotorasib y el adagrasib son los medicamentos recientemente aprobados que se dirigen selectivamente a KRAS G12C y ofrecen nuevos enfoques de tratamiento para mejorar los resultados de los pacientes, sin embargo, con frecuencia surge la resistencia a los medicamentos. El desarrollo de fármacos es un proceso desafiante, costoso y lento. Recientemente, el cribado virtual basado en el aprendizaje automático se utiliza para el desarrollo de nuevos fármacos. En este estudio, realizamos un cribado virtual basado en el aprendizaje automático seguido de acoplamiento molecular, simulación de dinámica molecular de todos los átomos y cálculos de energía de unión para las identificaciones de nuevos inhibidores contra el mutante KRAS G12C. En este estudio, se utilizaron cuatro modelos de aprendizaje automático que incluyen, bosque aleatorio, vecinos k-más cercanos, Bayes ingenuo gaussiano y máquina de vectores de soporte. Mediante el uso de un conjunto de datos externos y una validación cruzada de 5 veces, se validaron los modelos desarrollados. Entre todos los modelos, el rendimiento del modelo de bosque aleatorio (RF) fue mejor en el conjunto de datos de tren/prueba y en el conjunto de datos externos. El modelo de bosque aleatorio se utilizó además para la selección virtual de la base de datos ZINC15, la base de datos interna, los fitoquímicos paquistaníes y la base de datos de productos naturales de Sudáfrica. Se realizó un total de 100 ns de simulación MD para los cuatro mejores complejos de puntuación de acoplamiento, así como el compuesto estándar en complejo con KRAS G12C . Además, los cuatro éxitos principales revelaron una mayor estabilidad y mayores afinidades de unión para KRAS G12C en comparación con el fármaco estándar. Estos nuevos resultados tienen el potencial de inhibir KRAS G12C y pueden ayudar a prevenir el cáncer de pulmón asociado a KRAS. Todos los conjuntos de datos utilizados en este estudio pueden estar disponibles gratuitamente en ( https://github.com/Amar-Ajmal/Datasets-for-KRAS ).

Files

s13065-024-01152-z.pdf

Files (4.8 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:eb2baa460f6d4f009f4701d088bcf29e
4.8 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
مكن الفحص الافتراضي المحتمل جنبًا إلى جنب مع المحاكاة الجزيئية الحيوية من تحديد مثبطات جديدة لهدف عقار KRAS
Translated title (French)
Le dépistage virtuel prospectif combiné à la simulation biomoléculaire a permis l'identification de nouveaux inhibiteurs pour la cible du médicament KRAS
Translated title (Spanish)
El cribado virtual prospectivo combinado con la simulación biomolecular permitió la identificación de nuevos inhibidores para la diana farmacológica KRAS

Identifiers

Other
https://openalex.org/W4393143798
DOI
10.1186/s13065-024-01152-z

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Pakistan

References

  • https://openalex.org/W1968319881
  • https://openalex.org/W2031570350
  • https://openalex.org/W2143426320
  • https://openalex.org/W2158698691
  • https://openalex.org/W2255811425
  • https://openalex.org/W2342603028
  • https://openalex.org/W2375821550
  • https://openalex.org/W2521029800
  • https://openalex.org/W2766108561
  • https://openalex.org/W2766300642
  • https://openalex.org/W2791592925
  • https://openalex.org/W2807319534
  • https://openalex.org/W2915626801
  • https://openalex.org/W2922496237
  • https://openalex.org/W2942636629
  • https://openalex.org/W2959938226
  • https://openalex.org/W2969325194
  • https://openalex.org/W2982321167
  • https://openalex.org/W2998581726
  • https://openalex.org/W3003697872
  • https://openalex.org/W3009282180
  • https://openalex.org/W3037825825
  • https://openalex.org/W3040529672
  • https://openalex.org/W3086524105
  • https://openalex.org/W3099252273
  • https://openalex.org/W3109029050
  • https://openalex.org/W3128706316
  • https://openalex.org/W3157307328
  • https://openalex.org/W3157480760
  • https://openalex.org/W3159313223
  • https://openalex.org/W3172081492
  • https://openalex.org/W3185516026
  • https://openalex.org/W3192834065
  • https://openalex.org/W3193808108
  • https://openalex.org/W3194982939
  • https://openalex.org/W3197950246
  • https://openalex.org/W4200205405
  • https://openalex.org/W4210522876
  • https://openalex.org/W4213320225
  • https://openalex.org/W4220791525
  • https://openalex.org/W4220910797
  • https://openalex.org/W4220950248
  • https://openalex.org/W4229374235
  • https://openalex.org/W4280504740
  • https://openalex.org/W4285987606
  • https://openalex.org/W4289135395
  • https://openalex.org/W4292805220
  • https://openalex.org/W4292814071
  • https://openalex.org/W4293176236
  • https://openalex.org/W4296002892
  • https://openalex.org/W4307430007
  • https://openalex.org/W4323364318
  • https://openalex.org/W4367549209
  • https://openalex.org/W4383998275
  • https://openalex.org/W4386847912
  • https://openalex.org/W4389304566
  • https://openalex.org/W4390114224