Published August 20, 2021 | Version v1
Publication Open

An end-to-end heterogeneous graph attention network for <i>Mycobacterium tuberculosis</i> drug-resistance prediction

  • 1. University of Oxford
  • 2. Suzhou Research Institute
  • 3. Oxford University Clinical Research Unit
  • 4. University of Surrey
  • 5. John Radcliffe Hospital

Description

Antimicrobial resistance (AMR) poses a threat to global public health. To mitigate the impacts of AMR, it is important to identify the molecular mechanisms of AMR and thereby determine optimal therapy as early as possible. Conventional machine learning-based drug-resistance analyses assume genetic variations to be homogeneous, thus not distinguishing between coding and intergenic sequences. In this study, we represent genetic data from Mycobacterium tuberculosis as a graph, and then adopt a deep graph learning method-heterogeneous graph attention network ('HGAT-AMR')-to predict anti-tuberculosis (TB) drug resistance. The HGAT-AMR model is able to accommodate incomplete phenotypic profiles, as well as provide 'attention scores' of genes and single nucleotide polymorphisms (SNPs) both at a population level and for individual samples. These scores encode the inputs, which the model is 'paying attention to' in making its drug resistance predictions. The results show that the proposed model generated the best area under the receiver operating characteristic (AUROC) for isoniazid and rifampicin (98.53 and 99.10%), the best sensitivity for three first-line drugs (94.91% for isoniazid, 96.60% for ethambutol and 90.63% for pyrazinamide), and maintained performance when the data were associated with incomplete phenotypes (i.e. for those isolates for which phenotypic data for some drugs were missing). We also demonstrate that the model successfully identifies genes and SNPs associated with drug resistance, mitigating the impact of resistance profile while considering particular drug resistance, which is consistent with domain knowledge.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تشكل مقاومة مضادات الميكروبات (AMR) تهديدًا للصحة العامة العالمية. للتخفيف من آثار مقاومة مضادات الميكروبات، من المهم تحديد الآليات الجزيئية لمقاومة مضادات الميكروبات وبالتالي تحديد العلاج الأمثل في أقرب وقت ممكن. تفترض التحليلات التقليدية لمقاومة الأدوية القائمة على التعلم الآلي أن الاختلافات الجينية متجانسة، وبالتالي لا تميز بين الترميز والتسلسلات بين الجينات. في هذه الدراسة، نمثل البيانات الوراثية من المتفطرة السلية كرسم بياني، ثم نعتمد طريقة تعلم الرسم البياني العميق - شبكة الانتباه غير المتجانسة للرسم البياني (" HGAT - AMR ")- للتنبؤ بمقاومة الأدوية المضادة للسل (TB). نموذج HGAT - AMR قادر على استيعاب ملفات تعريف النمط الظاهري غير المكتملة، بالإضافة إلى توفير "درجات الانتباه" للجينات والأشكال المتعددة للنيوكليوتيدات المفردة (SNPs) على مستوى السكان وللعينات الفردية. تشفر هذه الدرجات المدخلات، التي "يوليها النموذج الاهتمام" عند إجراء تنبؤاته بمقاومة الأدوية. أظهرت النتائج أن النموذج المقترح أنتج أفضل منطقة تحت خاصية تشغيل جهاز الاستقبال (AUROC) للإيزونيازيد والريفامبيسين (98.53 و 99.10 ٪)، وأفضل حساسية لثلاثة أدوية من الخط الأول (94.91 ٪ للإيزونيازيد، و 96.60 ٪ للإيثامبوتول و 90.63 ٪ للبيرازيناميد)، وحافظ على الأداء عندما ارتبطت البيانات بأنماط ظاهرية غير مكتملة (أي بالنسبة للعزلات التي كانت بيانات النمط الظاهري لبعض الأدوية مفقودة). كما نوضح أن النموذج يحدد بنجاح الجينات و SNPs المرتبطة بمقاومة الأدوية، مما يخفف من تأثير ملف المقاومة مع مراعاة مقاومة أدوية معينة، والتي تتوافق مع معرفة المجال.

Translated Description (French)

La résistance aux antimicrobiens (RAM) constitue une menace pour la santé publique mondiale. Pour atténuer les impacts de la RAM, il est important d'identifier les mécanismes moléculaires de la RAM et de déterminer ainsi le traitement optimal le plus tôt possible. Les analyses conventionnelles de pharmacorésistance basées sur l'apprentissage automatique supposent que les variations génétiques sont homogènes, ne faisant donc pas de distinction entre les séquences codantes et intergéniques. Dans cette étude, nous représentons les données génétiques de Mycobacterium tuberculosis sous forme de graphique, puis nous adoptons une méthode d'apprentissage en graphe profond - le réseau d'attention à graphe hétérogène (« HGAT-AMR »)- pour prédire la résistance aux médicaments antituberculeux (TB). Le modèle HGAT-AMR est capable de s'adapter à des profils phénotypiques incomplets, ainsi que de fournir des « scores d'attention » de gènes et de polymorphismes mononucléotidiques (SNP) à la fois au niveau de la population et pour des échantillons individuels. Ces scores codent les données d'entrée, auxquelles le modèle « prête attention » lorsqu'il fait ses prédictions de résistance aux médicaments. Les résultats montrent que le modèle proposé a généré la meilleure surface sous la caractéristique de fonctionnement du récepteur (AUROC) pour l'isoniazide et la rifampicine (98,53 et 99,10 %), la meilleure sensibilité pour trois médicaments de première intention (94,91 % pour l'isoniazide, 96,60 % pour l'éthambutol et 90,63 % pour le pyrazinamide), et a maintenu les performances lorsque les données étaient associées à des phénotypes incomplets (c'est-à-dire pour les isolats pour lesquels les données phénotypiques de certains médicaments étaient manquantes). Nous démontrons également que le modèle identifie avec succès les gènes et les SNP associés à la pharmacorésistance, atténuant l'impact du profil de résistance tout en tenant compte de la pharmacorésistance particulière, ce qui est cohérent avec les connaissances du domaine.

Translated Description (Spanish)

La resistencia a los antimicrobianos (RAM) representa una amenaza para la salud pública mundial. Para mitigar los impactos de la resistencia a los antimicrobianos, es importante identificar los mecanismos moleculares de la resistencia a los antimicrobianos y, por lo tanto, determinar la terapia óptima lo antes posible. Los análisis convencionales de resistencia a los medicamentos basados en el aprendizaje automático asumen que las variaciones genéticas son homogéneas, por lo que no distinguen entre secuencias codificantes e intergénicas. En este estudio, representamos los datos genéticos de Mycobacterium tuberculosis como un gráfico, y luego adoptamos un método de aprendizaje gráfico profundo, la red de atención gráfica heterogénea ('HGAT-AMR'), para predecir la resistencia a los medicamentos contra la tuberculosis (TB). El modelo HGAT-AMR es capaz de acomodar perfiles fenotípicos incompletos, así como proporcionar "puntuaciones de atención" de genes y polimorfismos de un solo nucleótido (SNP) tanto a nivel de población como para muestras individuales. Estas puntuaciones codifican las entradas, a las que el modelo está "prestando atención" al hacer sus predicciones de resistencia a los medicamentos. Los resultados muestran que el modelo propuesto generó la mejor área bajo la característica operativa del receptor (AUROC) para isoniazida y rifampicina (98,53 y 99,10%), la mejor sensibilidad para tres fármacos de primera línea (94,91% para isoniazida, 96,60% para etambutol y 90,63% para pirazinamida), y mantuvo el rendimiento cuando los datos se asociaron con fenotipos incompletos (es decir, para aquellos aislados para los que faltaban datos fenotípicos para algunos fármacos). También demostramos que el modelo identifica con éxito genes y SNP asociados con la resistencia a los medicamentos, mitigando el impacto del perfil de resistencia al considerar la resistencia a los medicamentos en particular, lo cual es consistente con el conocimiento del dominio.

Files

bbab299.pdf.pdf

Files (93 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:b0d506893d4802090edf1644f5f082cd
93 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
شبكة اهتمام بيانية غير متجانسة من البداية إلى النهاية للتنبؤ بمقاومة <i>المتفطرة السلية</i> للأدوية
Translated title (French)
Un réseau d'attention graphique hétérogène de bout en bout pour la prédiction de <i>la pharmacorésistance de Mycobacterium tuberculosis</i>
Translated title (Spanish)
Una red de atención gráfica heterogénea de extremo a extremo para la predicción de resistencia a los medicamentos de <i>Mycobacterium tuberculosis</i>

Identifiers

Other
https://openalex.org/W3195766468
DOI
10.1093/bib/bbab299

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Vietnam

References

  • https://openalex.org/W1863711781
  • https://openalex.org/W2129205084
  • https://openalex.org/W2559452838
  • https://openalex.org/W2771835478
  • https://openalex.org/W2901155787
  • https://openalex.org/W2902271181
  • https://openalex.org/W2905224888
  • https://openalex.org/W2928080709
  • https://openalex.org/W2951274106
  • https://openalex.org/W2970398671
  • https://openalex.org/W2987119394
  • https://openalex.org/W2997828579
  • https://openalex.org/W3002626985
  • https://openalex.org/W3011667710
  • https://openalex.org/W3017681976
  • https://openalex.org/W3095963322
  • https://openalex.org/W4297733535