Published December 28, 2023 | Version v1
Publication Open

MHCSeqNet2 - Improved Peptide-Class I MHC Binding Prediction for Alleles with Low Data

  • 1. Chulalongkorn University

Description

Abstract Motivation The binding of a peptide antigen to a class I major histocompatibility complex (MHC) protein is part of a key process that lets the immune system recognize an infected cell or a cancer cell. This mechanism enabled the development of peptide-based vaccines that can activate the patient's immune response to treat cancers. Hence, the ability of accurately predict peptide-MHC binding is an essential component for prioritizing the best peptides for each patient. However, peptide-MHC binding experimental data for many MHC alleles are still lacking, which limited the accuracy of existing prediction models. Results In this study, we presented an improved version of MHCSeqNet that utilized sub-word-level peptide features, a 3D structure embedding for MHC alleles, and an expanded training dataset to achieve better generalizability on MHC alleles with small amounts of data. Visualization of MHC allele embeddings confirms that the model was able to group alleles with similar binding specificity, including those with no peptide ligand in the training dataset. Furthermore, an external evaluation suggests that MHCSeqNet2 can improve the prioritization of T cell epitopes for MHC alleles with small amount of training data. Availability and implementation The source code and installation instruction for MHCSeqNet2 is available at https://github.com/cmb-chula/MHCSeqNet2 Supplementary information Supplementary data are available at Bioinformatics online.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

التحفيز التجريدي إن ربط مستضد الببتيد ببروتين مركب التوافق النسيجي الرئيسي من الفئة الأولى (MHC) هو جزء من عملية رئيسية تسمح للجهاز المناعي بالتعرف على خلية مصابة أو خلية سرطانية. مكنت هذه الآلية من تطوير لقاحات قائمة على الببتيد يمكنها تنشيط الاستجابة المناعية للمريض لعلاج السرطان. وبالتالي، فإن القدرة على التنبؤ بدقة بربط الببتيد MHC هي عنصر أساسي لتحديد أولويات أفضل الببتيدات لكل مريض. ومع ذلك، لا تزال البيانات التجريبية لربط الببتيد- MHC للعديد من أليلات MHC غير موجودة، مما يحد من دقة نماذج التنبؤ الحالية. النتائج في هذه الدراسة، قدمنا نسخة محسنة من MHCSeqNet التي استخدمت ميزات الببتيد على مستوى الكلمات الفرعية، وتضمين هيكل ثلاثي الأبعاد لأليلات MHC، ومجموعة بيانات تدريب موسعة لتحقيق تعميم أفضل على أليلات MHC بكميات صغيرة من البيانات. يؤكد تصور تضمينات أليل MHC أن النموذج كان قادرًا على تجميع أليلات ذات خصوصية ربط مماثلة، بما في ذلك تلك التي لا تحتوي على ربيطة ببتيد في مجموعة بيانات التدريب. علاوة على ذلك، يشير تقييم خارجي إلى أن MHCSeqNet2 يمكن أن يحسن تحديد أولويات حواتم الخلايا التائية لأليلات MHC بكمية صغيرة من بيانات التدريب. التوافر والتنفيذ تتوفر التعليمات البرمجية المصدر وتعليمات التثبيت لـ MHCSeqNet2 على https://github.com/cmb-chula/MHCSeqNet2 تتوفر البيانات التكميلية على Bioinformatics عبر الإنترنت.

Translated Description (French)

Motivation abstraite La liaison d'un antigène peptidique à une protéine du complexe majeur d'histocompatibilité (CMH) de classe I fait partie d'un processus clé qui permet au système immunitaire de reconnaître une cellule infectée ou une cellule cancéreuse. Ce mécanisme a permis le développement de vaccins à base de peptides qui peuvent activer la réponse immunitaire du patient pour traiter les cancers. Par conséquent, la capacité de prédire avec précision la liaison peptide-MHC est un élément essentiel pour prioriser les meilleurs peptides pour chaque patient. Cependant, les données expérimentales de liaison peptide-CMH pour de nombreux allèles du CMH font toujours défaut, ce qui limite la précision des modèles de prédiction existants. Résultats Dans cette étude, nous avons présenté une version améliorée de MHCSeqNet qui utilisait des caractéristiques peptidiques au niveau des sous-mots, une intégration de structure 3D pour les allèles du CMH et un ensemble de données d'entraînement élargi pour obtenir une meilleure généralisation sur les allèles du CMH avec de petites quantités de données. La visualisation des intégrations d'allèles du CMH confirme que le modèle a pu regrouper des allèles ayant une spécificité de liaison similaire, y compris ceux sans ligand peptidique dans l'ensemble de données d'entraînement. En outre, une évaluation externe suggère que MHCSeqNet2 peut améliorer la priorisation des épitopes des lymphocytes T pour les allèles du CMH avec une petite quantité de données d'entraînement. Disponibilité et mise en œuvre Le code source et les instructions d'installation de MHCSeqNet2 sont disponibles sur https://github.com/cmb-chula/MHCSeqNet2 Informations supplémentaires Des données supplémentaires sont disponibles sur Bioinformatics en ligne.

Translated Description (Spanish)

Motivación abstracta La unión de un antígeno peptídico a una proteína del complejo mayor de histocompatibilidad (MHC) de clase I es parte de un proceso clave que permite que el sistema inmunitario reconozca una célula infectada o una célula cancerosa. Este mecanismo permitió el desarrollo de vacunas basadas en péptidos que pueden activar la respuesta inmune del paciente para tratar cánceres. Por lo tanto, la capacidad de predecir con precisión la unión péptido-MHC es un componente esencial para priorizar los mejores péptidos para cada paciente. Sin embargo, aún faltan datos experimentales de unión péptido-MHC para muchos alelos del MHC, lo que limita la precisión de los modelos de predicción existentes. Resultados En este estudio, presentamos una versión mejorada de MHCSeqNet que utilizaba características de péptidos a nivel de subpalabras, una incrustación de estructura 3D para alelos de MHC y un conjunto de datos de entrenamiento ampliado para lograr una mejor generalización en alelos de MHC con pequeñas cantidades de datos. La visualización de las incrustaciones de alelos del MHC confirma que el modelo fue capaz de agrupar alelos con especificidad de unión similar, incluidos aquellos sin ligando peptídico en el conjunto de datos de entrenamiento. Además, una evaluación externa sugiere que MHCSeqNet2 puede mejorar la priorización de epítopos de células T para alelos de MHC con una pequeña cantidad de datos de entrenamiento. Disponibilidad e implementación El código fuente y las instrucciones de instalación de MHCSeqNet2 están disponibles en https://github.com/cmb-chula/MHCSeqNet2 Información complementaria Los datos complementarios están disponibles en Bioinformatics online.

Files

btad780.pdf.pdf

Files (93 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:b0d506893d4802090edf1644f5f082cd
93 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
MHCSeqNet2 - تحسين تنبؤ ربط MHC من الفئة الأولى من الببتيد للأليلات ذات البيانات المنخفضة
Translated title (French)
MHCSeqNet2 - Amélioration de la prédiction de la liaison du CMH de classe peptidique I pour les allèles avec de faibles données
Translated title (Spanish)
MHCSeqNet2 - Predicción mejorada de la unión a MHC de péptido de clase I para alelos con datos bajos

Identifiers

Other
https://openalex.org/W4390345176
DOI
10.1093/bioinformatics/btad780

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Thailand

References

  • https://openalex.org/W1510865194
  • https://openalex.org/W1519266993
  • https://openalex.org/W1982271112
  • https://openalex.org/W2125732073
  • https://openalex.org/W2155786171
  • https://openalex.org/W2271914738
  • https://openalex.org/W2589139221
  • https://openalex.org/W2597129987
  • https://openalex.org/W2754733375
  • https://openalex.org/W2898389621
  • https://openalex.org/W2947980028
  • https://openalex.org/W2949747739
  • https://openalex.org/W2950627686
  • https://openalex.org/W2971621113
  • https://openalex.org/W2979770225
  • https://openalex.org/W2979882137
  • https://openalex.org/W2995389725
  • https://openalex.org/W2996241254
  • https://openalex.org/W3024570138
  • https://openalex.org/W3042910002
  • https://openalex.org/W3091991776
  • https://openalex.org/W3095108548
  • https://openalex.org/W3112376646
  • https://openalex.org/W3113096828
  • https://openalex.org/W3184125572
  • https://openalex.org/W4220839878