A phylogenomic approach to bacterial subspecies classification: proof of concept in Mycobacterium abscessus
- 1. University Malaya Medical Centre
- 2. University of Malaya
Description
Mycobacterium abscessus is a rapidly growing mycobacterium that is often associated with human infections. The taxonomy of this species has undergone several revisions and is still being debated. In this study, we sequenced the genomes of 12 M. abscessus strains and used phylogenomic analysis to perform subspecies classification.A data mining approach was used to rank and select informative genes based on the relative entropy metric for the construction of a phylogenetic tree. The resulting tree topology was similar to that generated using the concatenation of five classical housekeeping genes: rpoB, hsp65, secA, recA and sodA. Additional support for the reliability of the subspecies classification came from the analysis of erm41 and ITS gene sequences, single nucleotide polymorphisms (SNPs)-based classification and strain clustering demonstrated by a variable number tandem repeat (VNTR) assay and a multilocus sequence analysis (MLSA). We subsequently found that the concatenation of a minimal set of three median-ranked genes: DNA polymerase III subunit alpha (polC), 4-hydroxy-2-ketovalerate aldolase (Hoa) and cell division protein FtsZ (ftsZ), is sufficient to recover the same tree topology. PCR assays designed specifically for these genes showed that all three genes could be amplified in the reference strain of M. abscessus ATCC 19977T.This study provides proof of concept that whole-genome sequence-based data mining approach can provide confirmatory evidence of the phylogenetic informativeness of existing markers, as well as lead to the discovery of a more economical and informative set of markers that produces similar subspecies classification in M. abscessus. The systematic procedure used in this study to choose the informative minimal set of gene markers can potentially be applied to species or subspecies classification of other bacteria.
Translated Descriptions
Translated Description (Arabic)
المتفطرة الخراجية هي بكتيريا فطرية تنمو بسرعة وغالبًا ما ترتبط بالعدوى البشرية. خضع تصنيف هذا النوع لعدة مراجعات ولا يزال قيد المناقشة. في هذه الدراسة، قمنا بتسلسل جينوم 12 م. سلالات الخراج واستخدمنا التحليل الوراثي السلالي لإجراء تصنيف السلالات الفرعية. تم استخدام نهج استخراج البيانات لترتيب واختيار الجينات المفيدة بناءً على مقياس الانتروبيا النسبي لبناء شجرة تطور السلالات. كانت طوبولوجيا الأشجار الناتجة مماثلة لتلك التي تم إنشاؤها باستخدام تسلسل خمسة جينات تقليدية للتدبير المنزلي: rpoB و hsp65 و secA و recA و sodA. جاء الدعم الإضافي لموثوقية تصنيف السلالات الفرعية من تحليل إيرم 41 وتسلسلها الجيني، والتصنيف القائم على النيوكليوتيدات المفردة (SNPs)، وتجميع السلالات الذي أظهره اختبار التكرار الترادفي للأرقام المتغيرة (VNTR) وتحليل التسلسل متعدد البؤر (MLSA). وجدنا لاحقًا أن تسلسل مجموعة دنيا من ثلاثة جينات متوسطة التصنيف: DNA polymerase III subunit alpha (polC) و 4 - hydroxy -2 - ketovalerate aldolase (HOA) وبروتين انقسام الخلايا FtsZ (ftsZ)، يكفي لاستعادة نفس طوبولوجيا الأشجار. أظهرت فحوصات تفاعل البوليميراز المتسلسل المصممة خصيصًا لهذه الجينات أنه يمكن تضخيم جميع الجينات الثلاثة في السلالة المرجعية لـ M. abscessus ATCC 19977T. تقدم هذه الدراسة دليلًا على المفهوم القائل بأن نهج استخراج البيانات القائم على تسلسل الجينوم الكامل يمكن أن يوفر دليلًا تأكيديًا على المعلوماتية الوراثية للعلامات الموجودة، وكذلك يؤدي إلى اكتشاف مجموعة من العلامات الأكثر اقتصادا وغنية بالمعلومات التي تنتج تصنيفًا مماثلًا للنوع الفرعي في M. abscessus. يمكن تطبيق الإجراء المنهجي المستخدم في هذه الدراسة لاختيار الحد الأدنى من مجموعة الواسمات الجينية المفيدة على تصنيف الأنواع أو الأنواع الفرعية للبكتيريا الأخرى.Translated Description (French)
Mycobacterium abscessus est une mycobactérie à croissance rapide qui est souvent associée à des infections humaines. La taxonomie de cette espèce a fait l'objet de plusieurs révisions et fait encore l'objet de débats. Dans cette étude, nous avons séquencé les génomes de 12 souches de M. abscessus et utilisé l'analyse phylogénomique pour effectuer la classification des sous-espèces. Une approche d'exploration de données a été utilisée pour classer et sélectionner des gènes informatifs en fonction de la métrique d'entropie relative pour la construction d'un arbre phylogénétique. La topologie arborescente résultante était similaire à celle générée par la concaténation de cinq gènes d'entretien classiques : rpoB, hsp65, secA, recA et sodA. Un soutien supplémentaire pour la fiabilité de la classification de la sous-espèce est venu de l'analyse d'erm41 et de SES séquences géniques, de la classification basée sur les polymorphismes mononucléotidiques (SNP) et du regroupement des souches démontré par un test de répétition en tandem à nombre variable (VNTR) et une analyse de séquence multilocus (MLSA). Nous avons par la suite constaté que la concaténation d'un ensemble minimal de trois gènes de rang médian : la sous-unité alpha de l'ADN polymérase III (polC), la 4-hydroxy-2-cétovalérate aldolase (Hoa) et la protéine de division cellulaire FtsZ (ftsZ), est suffisante pour récupérer la même topologie arborescente. Les essais PCR conçus spécifiquement pour ces gènes ont montré que les trois gènes pouvaient être amplifiés dans la souche de référence de M. abscessus ATCC 19977T.Cette étude fournit la preuve de concept que l'approche d'exploration de données basée sur la séquence du génome entier peut fournir des preuves confirmatives de l'informativité phylogénétique des marqueurs existants, ainsi que conduire à la découverte d'un ensemble de marqueurs plus économique et informatif qui produit une classification de sous-espèce similaire chez M. abscessus. La procédure systématique utilisée dans cette étude pour choisir l'ensemble minimal informatif de marqueurs génétiques peut potentiellement être appliquée à la classification des espèces ou des sous-espèces d'autres bactéries.Translated Description (Spanish)
Mycobacterium abscessus es una micobacteria de rápido crecimiento que a menudo se asocia con infecciones humanas. La taxonomía de esta especie ha sufrido varias revisiones y aún se está debatiendo. En este estudio, secuenciamos los genomas de 12 cepas de M. abscessus y utilizamos el análisis filogenómico para realizar la clasificación de subespecies. Se utilizó un enfoque de minería de datos para clasificar y seleccionar genes informativos basados en la métrica de entropía relativa para la construcción de un árbol filogenético. La topología de árbol resultante fue similar a la generada utilizando la concatenación de cinco genes constitutivos clásicos: rpoB, hsp65, secA, recA y sodA. El apoyo adicional para la fiabilidad de la clasificación de subespecies provino del análisis de erm41 y SUS secuencias génicas, la clasificación basada en polimorfismos de un solo nucleótido (SNP) y el agrupamiento de cepas demostrado por un ensayo de repetición en tándem de número variable (VNTR) y un análisis de secuencia multilocus (MLSA). Posteriormente, descubrimos que la concatenación de un conjunto mínimo de tres genes de rango medio: subunidad alfa de ADN polimerasa III (polC), 4-hidroxi-2-cetovalerato aldolasa (Hoa) y proteína de división celular FtsZ (ftsZ), es suficiente para recuperar la misma topología de árbol. Los ensayos de PCR diseñados específicamente para estos genes mostraron que los tres genes podrían amplificarse en la cepa de referencia de M. abscessus ATCC 19977T. Este estudio proporciona una prueba de concepto de que el enfoque de minería de datos basado en la secuencia del genoma completo puede proporcionar evidencia confirmatoria de la informatividad filogenética de los marcadores existentes, así como conducir al descubrimiento de un conjunto de marcadores más económico e informativo que produce una clasificación de subespecies similares en M. abscessus. El procedimiento sistemático utilizado en este estudio para elegir el conjunto mínimo informativo de marcadores genéticos se puede aplicar potencialmente a la clasificación de especies o subespecies de otras bacterias.Files
1471-2164-14-879.pdf
Files
(4.5 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:cecf5e45e322e2d5fb2b6aeae32603b3
|
4.5 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- نهج علم تطور السلالات لتصنيف الأنواع الفرعية البكتيرية: إثبات المفهوم في خراج المتفطرة
- Translated title (French)
- Une approche phylogénomique de la classification des sous-espèces bactériennes : preuve de concept chez Mycobacterium abscessus
- Translated title (Spanish)
- Un enfoque filogenómico para la clasificación de subespecies bacterianas: prueba de concepto en Mycobacterium abscessus
Identifiers
- Other
- https://openalex.org/W2047453719
- DOI
- 10.1186/1471-2164-14-879
References
- https://openalex.org/W1547900160
- https://openalex.org/W1556539514
- https://openalex.org/W1572040656
- https://openalex.org/W1702821616
- https://openalex.org/W1735772520
- https://openalex.org/W1821277652
- https://openalex.org/W1940462397
- https://openalex.org/W1966675671
- https://openalex.org/W1974568028
- https://openalex.org/W1979459309
- https://openalex.org/W2004548026
- https://openalex.org/W2005898776
- https://openalex.org/W2009063610
- https://openalex.org/W2021463425
- https://openalex.org/W2023162152
- https://openalex.org/W2023967869
- https://openalex.org/W2035608997
- https://openalex.org/W2036780345
- https://openalex.org/W2044270321
- https://openalex.org/W2045232153
- https://openalex.org/W2055043387
- https://openalex.org/W2056568233
- https://openalex.org/W2070440819
- https://openalex.org/W2090286184
- https://openalex.org/W2097555066
- https://openalex.org/W2104312632
- https://openalex.org/W2109817419
- https://openalex.org/W2111414304
- https://openalex.org/W2114658413
- https://openalex.org/W2114834842
- https://openalex.org/W2118128934
- https://openalex.org/W2121037925
- https://openalex.org/W2124773215
- https://openalex.org/W2127774996
- https://openalex.org/W2129095203
- https://openalex.org/W2132632499
- https://openalex.org/W2132926880
- https://openalex.org/W2134409883
- https://openalex.org/W2137015675
- https://openalex.org/W2137190175
- https://openalex.org/W2142447693
- https://openalex.org/W2144727585
- https://openalex.org/W2145608399
- https://openalex.org/W2145754091
- https://openalex.org/W2145922409
- https://openalex.org/W2147478688
- https://openalex.org/W2148723086
- https://openalex.org/W2150823021
- https://openalex.org/W2154690357
- https://openalex.org/W2155320525
- https://openalex.org/W2158714788
- https://openalex.org/W2159604303
- https://openalex.org/W2165425953
- https://openalex.org/W2166154339
- https://openalex.org/W2170647696
- https://openalex.org/W2582743722
- https://openalex.org/W4233815609
- https://openalex.org/W4241422942
- https://openalex.org/W4294216483