Published March 6, 2006 | Version v1
Publication Open

Mycobacterium tuberculosis complex genetic diversity: mining the fourth international spoligotyping database (SpolDB4) for classification, population genetics and epidemiology

  • 1. Institut Pasteur de la Guadeloupe
  • 2. New York State Department of Health
  • 3. Wadsworth Center
  • 4. Instituut voor Tropische Geneeskunde
  • 5. Innsbruck Medical University
  • 6. King Faisal Specialist Hospital & Research Centre
  • 7. Institut Pasteur
  • 8. Universidad Centroccidental Lisandro Alvarado
  • 9. Universidad de Zaragoza
  • 10. All India Institute of Medical Sciences
  • 11. Latvian Biomedical Research and Study Centre
  • 12. Universidade Federal do Rio Grande
  • 13. Instituto de Biotecnología y Biología Molecular
  • 14. University of Malaya
  • 15. Heinrich Heine University Düsseldorf
  • 16. Hospital General Universitario Gregorio Marañón
  • 17. University of Pisa
  • 18. Stellenbosch University
  • 19. Bhabha Atomic Research Centre
  • 20. National Institute for Public Health and the Environment
  • 21. Statens Serum Institut
  • 22. National Institute Of Hygiene And Epidemiology
  • 23. Hôpital Dupuytren
  • 24. Saint Petersburg Pasteur Institute
  • 25. Research Center Borstel - Leibniz Lung Center
  • 26. Dr. Hasan Sadikin General Hospital
  • 27. Padjadjaran University
  • 28. International Centre for Diarrhoeal Disease Research
  • 29. Institut Pasteur de Madagascar
  • 30. University of Łódź
  • 31. Hospital Universitario Miguel Servet
  • 32. State Research Center for Applied Microbiology and Biotechnology
  • 33. Semmelweis University
  • 34. Government of Northern Ireland
  • 35. Azienda Ospedaliero-Universitaria Careggi

Description

Abstract Background The Direct Repeat locus of the Mycobacterium tuberculosis complex (MTC) is a member of the CRISPR (Clustered regularly interspaced short palindromic repeats) sequences family. Spoligotyping is the widely used PCR-based reverse-hybridization blotting technique that assays the genetic diversity of this locus and is useful both for clinical laboratory, molecular epidemiology, evolutionary and population genetics. It is easy, robust, cheap, and produces highly diverse portable numerical results, as the result of the combination of (1) Unique Events Polymorphism (UEP) (2) Insertion-Sequence-mediated genetic recombination. Genetic convergence, although rare, was also previously demonstrated. Three previous international spoligotype databases had partly revealed the global and local geographical structures of MTC bacilli populations, however, there was a need for the release of a new, more representative and extended, international spoligotyping database. Results The fourth international spoligotyping database, SpolDB4, describes 1939 shared-types (STs) representative of a total of 39,295 strains from 122 countries, which are tentatively classified into 62 clades/lineages using a mixed expert-based and bioinformatical approach. The SpolDB4 update adds 26 new potentially phylogeographically-specific MTC genotype families. It provides a clearer picture of the current MTC genomes diversity as well as on the relationships between the genetic attributes investigated (spoligotypes) and the infra-species classification and evolutionary history of the species. Indeed, an independent Naïve-Bayes mixture-model analysis has validated main of the previous supervised SpolDB3 classification results, confirming the usefulness of both supervised and unsupervised models as an approach to understand MTC population structure. Updated results on the epidemiological status of spoligotypes, as well as genetic prevalence maps on six main lineages are also shown. Our results suggests the existence of fine geographical genetic clines within MTC populations, that could mirror the passed and present Homo sapiens sapiens demographical and mycobacterial co-evolutionary history whose structure could be further reconstructed and modelled, thereby providing a large-scale conceptual framework of the global TB Epidemiologic Network. Conclusion Our results broaden the knowledge of the global phylogeography of the MTC complex. SpolDB4 should be a very useful tool to better define the identity of a given MTC clinical isolate, and to better analyze the links between its current spreading and previous evolutionary history. The building and mining of extended MTC polymorphic genetic databases is in progress.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

نبذة مختصرة إن موضع التكرار المباشر لمركب السل المتفطرات (MTC) هو عضو في عائلة متواليات CRISPR (التكرارات المتناظرة القصيرة المتجمعة بانتظام). التنميط العكسي هو تقنية التهجين العكسي القائمة على تفاعل البوليميراز المتسلسل المستخدمة على نطاق واسع والتي تفحص التنوع الجيني لهذا الموضع وهي مفيدة لكل من المختبرات السريرية وعلم الأوبئة الجزيئية وعلم الوراثة التطوري والسكاني. إنه سهل وقوي ورخيص وينتج نتائج رقمية محمولة متنوعة للغاية، نتيجة لمزيج من (1) تعدد أشكال الأحداث الفريدة (UEP) (2) إعادة التركيب الجيني بوساطة تسلسل الإدراج. التقارب الجيني، على الرغم من ندرته، تم إثباته سابقًا. كشفت ثلاث قواعد بيانات سبوليغوتايب دولية سابقة جزئيًا عن الهياكل الجغرافية العالمية والمحلية لسكان عصيات MTC، ومع ذلك، كانت هناك حاجة إلى إطلاق قاعدة بيانات سبوليغوتايب دولية جديدة أكثر تمثيلاً وموسعة. تصف قاعدة البيانات الدولية الرابعة للنمط التشاركي، SpolDB4، 1939 نوعًا مشتركًا (STs) تمثل ما مجموعه 39295 سلالة من 122 دولة، والتي تم تصنيفها مبدئيًا إلى 62 سلالة/سلالة باستخدام نهج مختلط قائم على الخبراء والمعلوماتية الحيوية. يضيف تحديث SpolDB4 26 فصيلة جديدة من النمط الجيني MTC يحتمل أن تكون محددة جغرافيًا. إنه يوفر صورة أوضح لتنوع جينوم MTC الحالي وكذلك على العلاقات بين السمات الوراثية التي تم التحقيق فيها (spoligotypes) وتصنيف الأنواع تحت الحمراء والتاريخ التطوري للأنواع. في الواقع، قام تحليل نموذج خليط Naïve - Bayes المستقل بالتحقق من صحة النتائج الرئيسية لتصنيف SpolDB3 السابق الخاضع للإشراف، مما يؤكد فائدة كل من النماذج الخاضعة للإشراف وغير الخاضعة للإشراف كنهج لفهم البنية السكانية لـ MTC. كما تظهر نتائج محدثة حول الحالة الوبائية للأنماط الخبيثة، بالإضافة إلى خرائط الانتشار الوراثي على ست سلالات رئيسية. تشير نتائجنا إلى وجود سلاسل جينية جغرافية دقيقة بين مجموعات MTC، والتي يمكن أن تعكس التاريخ الديموغرافي والتطور الفطري للإنسان العاقل الذي يمكن إعادة بناء هيكله ونمذجته، وبالتالي توفير إطار مفاهيمي واسع النطاق للشبكة الوبائية العالمية للسل. الاستنتاج تعمل نتائجنا على توسيع المعرفة بالجغرافيا النباتية العالمية لمجمع MTC. يجب أن يكون SpolDB4 أداة مفيدة للغاية لتحديد هوية عزل MTC سريري معين بشكل أفضل، ولتحليل الروابط بين انتشاره الحالي والتاريخ التطوري السابق بشكل أفضل. يجري بناء واستخراج قواعد بيانات وراثية موسعة متعددة الأشكال MTC.

Translated Description (French)

Résumé Contexte Le locus de répétition directe du complexe Mycobacterium tuberculosis (MTC) est membre de la famille des séquences CRISPR (Clustered regular interspaced short palindromic repeats). Le spoligotypage est la technique de transfert par hybridation inverse basée sur la PCR largement utilisée qui analyse la diversité génétique de ce locus et est utile à la fois pour le laboratoire clinique, l'épidémiologie moléculaire, la génétique évolutive et la génétique des populations. Il est facile, robuste, bon marché et produit des résultats numériques portables très variés, résultant de la combinaison de (1) Polymorphisme des événements uniques (UEP) (2) Recombinaison génétique médiée par la séquence d'insertion. La convergence génétique, bien que rare, a également été démontrée précédemment. Trois bases de données internationales antérieures sur le spoligotype avaient en partie révélé les structures géographiques mondiales et locales des populations de bacilles MTC, mais il était nécessaire de publier une nouvelle base de données internationale plus représentative et étendue sur le spoligotypage. Résultats La quatrième base de données internationale de spoligotypage, SpolDB4, décrit 1939 types partagés (ST) représentatifs d'un total de 39 295 souches provenant de 122 pays, qui sont provisoirement classées en 62 clades/lignées en utilisant une approche mixte basée sur des experts et bioinformatique. La mise à jour de SpolDB4 ajoute 26 nouvelles familles de génotypes MTC potentiellement spécifiques à la phylogéographie. Il fournit une image plus claire de la diversité actuelle des génomes du MTC ainsi que des relations entre les attributs génétiques étudiés (spoligotypes) et la classification infra-espèce et l'histoire évolutive de l'espèce. En effet, une analyse indépendante du modèle de mélange Naïve-Bayes a validé les principaux résultats de la classification SpolDB3 supervisée précédente, confirmant l'utilité des modèles supervisés et non supervisés comme approche pour comprendre la structure de la population MTC. Des résultats actualisés sur l'état épidémiologique des spoligotypes, ainsi que des cartes de prévalence génétique sur six lignées principales sont également présentés. Nos résultats suggèrent l'existence de clines génétiques géographiques fines au sein des populations MTC, qui pourraient refléter l'histoire co-évolutionnaire démographique et mycobactérienne passée et présente d'Homo sapiens sapiens dont la structure pourrait être reconstruite et modélisée, fournissant ainsi un cadre conceptuel à grande échelle du réseau épidémiologique mondial de la tuberculose. Conclusion Nos résultats élargissent la connaissance de la phylogéographie globale du complexe MTC. SpolDB4 devrait être un outil très utile pour mieux définir l'identité d'un isolat clinique MTC donné et pour mieux analyser les liens entre sa propagation actuelle et ses antécédents évolutifs. La construction et l'exploitation de bases de données génétiques polymorphes MTC étendues sont en cours.

Translated Description (Spanish)

Antecedentes abstractos El locus de repetición directa del complejo de Mycobacterium tuberculosis (MTC) es un miembro de la familia de secuencias CRISPR (repeticiones palindrómicas cortas agrupadas regularmente interespaciadas). El espoligotipado es la técnica de transferencia de hibridación inversa basada en PCR ampliamente utilizada que analiza la diversidad genética de este locus y es útil tanto para el laboratorio clínico como para la epidemiología molecular, la genética evolutiva y la genética de poblaciones. Es fácil, robusto, barato y produce resultados numéricos portátiles muy diversos, como resultado de la combinación de (1) polimorfismo de eventos únicos (UEP) (2) recombinación genética mediada por secuencia de inserción. La convergencia genética, aunque rara, también se demostró previamente. Tres bases de datos de espoligotipos internacionales anteriores habían revelado en parte las estructuras geográficas globales y locales de las poblaciones de bacilos MTC, sin embargo, era necesario lanzar una nueva base de datos de espoligotipos internacional más representativa y ampliada. Resultados La cuarta base de datos internacional de espoligotipos, SpolDB4, describe 1939 tipos compartidos (ST) representativos de un total de 39.295 cepas de 122 países, que se clasifican provisionalmente en 62 clados/linajes utilizando un enfoque mixto basado en expertos y bioinformático. La actualización de SpolDB4 añade 26 nuevas familias de genotipos MTC potencialmente filogeográficamente específicas. Proporciona una imagen más clara de la diversidad actual de genomas de MTC, así como de las relaciones entre los atributos genéticos investigados (espoligotipos) y la clasificación infraespecie y la historia evolutiva de la especie. De hecho, un análisis independiente de modelos mixtos de Naïve-Bayes ha validado los principales resultados de la clasificación supervisada anterior de SpolDB3, confirmando la utilidad de los modelos supervisados y no supervisados como un enfoque para comprender la estructura de la población de MTC. También se muestran resultados actualizados sobre el estado epidemiológico de los espoligotipos, así como mapas de prevalencia genética en seis linajes principales. Nuestros resultados sugieren la existencia de clinas genéticas geográficas finas dentro de las poblaciones de MTC, que podrían reflejar la historia demográfica y micobacteriana coevolutiva pasada y presente de Homo sapiens sapiens, cuya estructura podría reconstruirse y modelarse aún más, proporcionando así un marco conceptual a gran escala de la Red Epidemiológica de TB global. Conclusión Nuestros resultados amplían el conocimiento de la filogeografía global del complejo MTC. SpolDB4 debería ser una herramienta muy útil para definir mejor la identidad de un aislado clínico de MTC dado y para analizar mejor los vínculos entre su propagación actual y la historia evolutiva previa. La construcción y extracción de bases de datos genéticas polimórficas MTC extendidas está en curso.

Files

1471-2180-6-23.pdf

Files (1.9 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:025169f2f14794013981b2d2d9431450
1.9 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
المتفطرة السلية المعقدة التنوع الجيني: تعدين قاعدة البيانات الدولية الرابعة للنمذجة العكسية (SpolDB4) للتصنيف وعلم الوراثة السكانية وعلم الأوبئة
Translated title (French)
Diversité génétique du complexe Mycobacterium tuberculosis : exploitation de la quatrième base de données internationale de spoligotypage (SpolDB4) pour la classification, la génétique des populations et l'épidémiologie
Translated title (Spanish)
Mycobacterium tuberculosis complex genetic diversity: mining the fourth international spoligotyping database (SpolDB4) for classification, population genetics and epidemiology

Identifiers

Other
https://openalex.org/W2096162460
DOI
10.1186/1471-2180-6-23

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Venezuela

References

  • https://openalex.org/W1495583714
  • https://openalex.org/W1516537577
  • https://openalex.org/W158851686
  • https://openalex.org/W1690650007
  • https://openalex.org/W1768047256
  • https://openalex.org/W186307931
  • https://openalex.org/W1922405592
  • https://openalex.org/W1966340693
  • https://openalex.org/W1966912234
  • https://openalex.org/W1969464199
  • https://openalex.org/W1973215898
  • https://openalex.org/W1973900107
  • https://openalex.org/W1979726037
  • https://openalex.org/W1986171241
  • https://openalex.org/W1987493454
  • https://openalex.org/W1990487336
  • https://openalex.org/W1992987228
  • https://openalex.org/W1994007828
  • https://openalex.org/W1998333026
  • https://openalex.org/W1999809115
  • https://openalex.org/W2003960936
  • https://openalex.org/W2008184711
  • https://openalex.org/W2017244653
  • https://openalex.org/W2036722597
  • https://openalex.org/W2042023792
  • https://openalex.org/W2044648876
  • https://openalex.org/W2044692417
  • https://openalex.org/W2053861265
  • https://openalex.org/W2060003027
  • https://openalex.org/W2068181475
  • https://openalex.org/W2078329360
  • https://openalex.org/W2080856256
  • https://openalex.org/W2082878124
  • https://openalex.org/W2084640924
  • https://openalex.org/W2087793347
  • https://openalex.org/W2096001430
  • https://openalex.org/W2096526135
  • https://openalex.org/W2098126593
  • https://openalex.org/W2098679442
  • https://openalex.org/W2099645570
  • https://openalex.org/W2100069291
  • https://openalex.org/W2102827392
  • https://openalex.org/W2105255620
  • https://openalex.org/W2105374782
  • https://openalex.org/W2105513728
  • https://openalex.org/W2110833355
  • https://openalex.org/W2111582999
  • https://openalex.org/W2116005940
  • https://openalex.org/W2117034387
  • https://openalex.org/W2117580564
  • https://openalex.org/W2118795566
  • https://openalex.org/W2118894325
  • https://openalex.org/W2119144539
  • https://openalex.org/W2120566369
  • https://openalex.org/W2126568957
  • https://openalex.org/W2126672627
  • https://openalex.org/W2127991349
  • https://openalex.org/W2128800381
  • https://openalex.org/W2129043771
  • https://openalex.org/W2132045514
  • https://openalex.org/W2132400817
  • https://openalex.org/W2133291901
  • https://openalex.org/W2134558351
  • https://openalex.org/W2135029894
  • https://openalex.org/W2137134809
  • https://openalex.org/W2140402634
  • https://openalex.org/W2141080968
  • https://openalex.org/W2142392294
  • https://openalex.org/W2147413485
  • https://openalex.org/W2150477652
  • https://openalex.org/W2156887574
  • https://openalex.org/W2157486063
  • https://openalex.org/W2157645392
  • https://openalex.org/W2162588694
  • https://openalex.org/W2162912294
  • https://openalex.org/W2168156690
  • https://openalex.org/W2169602677
  • https://openalex.org/W2400740436
  • https://openalex.org/W2410788242
  • https://openalex.org/W2411462760
  • https://openalex.org/W4241569127