Published July 19, 2023 | Version v1
Publication Open

A nearly complete and phased genome assembly of a Colombian<i>Trypanosoma cruzi</i>TcI strain and the evolution of gene families

Description

Abstract Chagas is an endemic disease in tropical regions of Latin America, caused by the parasite Trypanosoma cruzi . High intraspecies variability and genome complexity have been challenges for the development of genomic variation databases, needed to conduct studies in evolution, population genomics, and identification of genomic elements related to virulence and drug resistance in T. cruzi . Here we present a chromosome-level phased assembly of a T. cruzi strain (Dm25), isolated from a reservoir of the species Didelphis marsupialis located at the Tolima department in Colombia, and belonging to the TcI DTU. We obtained a primary haplotype composed of 32 chromosomes, 30 of them assembled in a single contig, and one complete copy of the maxicircle. While 29 chromosomes show a large collinearity with the assembly of the Brazil A4 strain, three chromosomes with a high density of repeat elements show a large divergence, compared to the Brazil A4 assembly. Considering that the distribution of heterozygous sites suggest that Dm25 is diploid, we assembled a second haplotype for 31 chromosomes, achieving an average of three contigs per chromosome. Nucleotide and protein evolution statistics indicate that T. cruzi Marinkellei separated before the diversification of T. cruzi in the known DTUs. Interchromosomal paralogs of dispersed gene families and histones appeared before but at the same time have a more strict purifying selection, compared to other repeat families. Previously unreported large tandem arrays of protein kinases and histones were identified in this assembly. Over one million variants obtained from Illumina reads aligned to the primary assembly clearly separate the main DTUs. We expect that this new assembly will be a valuable resource for further studies on evolution and functional genomics of Trypanosomatids .

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

الشاغاس التجريدي هو مرض مستوطن في المناطق الاستوائية في أمريكا اللاتينية، ناجم عن طفيلي المثقبيات الكروزية . كان التباين العالي بين الأنواع وتعقيد الجينوم من التحديات التي واجهت تطوير قواعد بيانات التباين الجيني، اللازمة لإجراء دراسات في التطور، وعلم الجينوم السكاني، وتحديد العناصر الجينية المتعلقة بالفوعة ومقاومة الأدوية في T. cruzi . نقدم هنا مجموعة مرحلية على مستوى الكروموسوم لسلالة T. cruzi (Dm25)، معزولة عن خزان من الأنواع Didelphis marsupialis الموجودة في قسم Tolima في كولومبيا، وتنتمي إلى TcI DTU. حصلنا على النمط الفرداني الأولي المكون من 32 كروموسومًا، 30 منها مجمعة في اتصال واحد، ونسخة كاملة واحدة من الدائرة العليا. في حين أن 29 كروموسومًا تظهر خطًا كبيرًا مع مجموعة سلالة البرازيل A4، فإن ثلاثة كروموسومات ذات كثافة عالية من العناصر المتكررة تظهر تباعدًا كبيرًا، مقارنةً بمجموعة البرازيل A4. بالنظر إلى أن توزيع المواقع غير المتجانسة يشير إلى أن Dm25 ثنائي الصيغة الصبغية، فقد قمنا بتجميع نمط فردي ثانٍ لـ 31 كروموسومًا، مما حقق متوسط ثلاثة تجاورات لكل كروموسوم. تشير إحصائيات تطور النيوكليوتيدات والبروتينات إلى أن T. cruzi Marinkellei انفصلت قبل تنويع T. cruzi في DTUs المعروفة. ظهرت نظائر بين الكروموسومات لعائلات الجينات المشتتة والهستونات من قبل ولكن في نفس الوقت لديها اختيار تنقية أكثر صرامة، مقارنة بالعائلات المتكررة الأخرى. تم تحديد مصفوفات ترادفية كبيرة لم يتم الإبلاغ عنها سابقًا من كينازات البروتين والهستونات في هذه التجميع. أكثر من مليون متغير تم الحصول عليها من قراءات Illumina المتوافقة مع التجميع الأساسي تفصل بوضوح وحدات DTU الرئيسية. نتوقع أن تكون هذه المجموعة الجديدة موردًا قيمًا لمزيد من الدراسات حول التطور وعلم الجينوم الوظيفي للمثقبيات .

Translated Description (French)

Résumé Le chagas est une maladie endémique dans les régions tropicales d'Amérique latine, causée par le parasite Trypanosoma cruzi . La forte variabilité intraspécifique et la complexité du génome ont constitué des défis pour le développement de bases de données sur les variations génomiques, nécessaires pour mener des études sur l'évolution, la génomique des populations et l'identification des éléments génomiques liés à la virulence et à la résistance aux médicaments chez T. cruzi . Nous présentons ici un assemblage chromosomique en phase d'une souche de T. cruzi (Dm25), isolée d'un réservoir de l'espèce Didelphis marsupialis situé au département de Tolima en Colombie, et appartenant à la TcI DTU. Nous avons obtenu un haplotype primaire composé de 32 chromosomes, 30 d'entre eux assemblés en un seul contig, et une copie complète du maxicircle. Alors que 29 chromosomes montrent une grande colinéarité avec l'assemblage de la souche Brazil A4, trois chromosomes avec une forte densité d'éléments répétés montrent une grande divergence, par rapport à l'assemblage Brazil A4. Considérant que la distribution des sites hétérozygotes suggère que Dm25 est diploïde, nous avons assemblé un second haplotype pour 31 chromosomes, atteignant une moyenne de trois contigs par chromosome. Les statistiques d'évolution des nucléotides et des protéines indiquent que T. cruzi Marinkellei s'est séparé avant la diversification de T. cruzi dans les DTU connus. Des paralogues interchromosomiques de familles de gènes et d'histones dispersés sont apparus auparavant mais ont en même temps une sélection purifiante plus stricte, par rapport à d'autres familles répétées. De grands réseaux en tandem de protéines kinases et d'histones non rapportés auparavant ont été identifiés dans cet assemblage. Plus d'un million de variantes obtenues à partir de lectures Illumina alignées sur l'assemblage primaire séparent clairement les principales DTU. Nous nous attendons à ce que cette nouvelle assemblée soit une ressource précieuse pour d'autres études sur l'évolution et la génomique fonctionnelle des trypanosomatides .

Translated Description (Spanish)

Resumen El Chagas es una enfermedad endémica en regiones tropicales de América Latina, causada por el parásito Trypanosoma cruzi . La alta variabilidad intraespecie y la complejidad del genoma han sido desafíos para el desarrollo de bases de datos de variación genómica, necesarias para realizar estudios en evolución, genómica de poblaciones e identificación de elementos genómicos relacionados con la virulencia y la resistencia a los medicamentos en T. cruzi . Aquí presentamos un ensamblaje en fases a nivel cromosómico de una cepa de T. cruzi (Dm25), aislada de un reservorio de la especie Didelphis marsupialis ubicado en el departamento de Tolima en Colombia, y perteneciente a la DTU TcI. Obtuvimos un haplotipo primario compuesto por 32 cromosomas, 30 de ellos ensamblados en un solo cóntigo, y una copia completa del maxicírculo. Mientras que 29 cromosomas muestran una gran colinealidad con el ensamblaje de la cepa A4 de Brasil, tres cromosomas con una alta densidad de elementos repetidos muestran una gran divergencia, en comparación con el ensamblaje A4 de Brasil. Teniendo en cuenta que la distribución de los sitios heterocigotos sugiere que Dm25 es diploide, ensamblamos un segundo haplotipo para 31 cromosomas, logrando una media de tres cóntigos por cromosoma. Las estadísticas de evolución de nucleótidos y proteínas indican que T. cruzi Marinkellei se separó antes de la diversificación de T. cruzi en las DTU conocidas. Los parálogos intercromosómicos de familias de genes dispersos e histonas aparecieron antes, pero al mismo tiempo tienen una selección purificadora más estricta, en comparación con otras familias de repetición. En este ensamblaje se identificaron grandes matrices en tándem de proteínas quinasas e histonas no informadas anteriormente. Más de un millón de variantes obtenidas de lecturas de Illumina alineadas con el ensamblaje primario separan claramente las DTU principales. Esperamos que este nuevo ensamblaje sea un recurso valioso para futuros estudios sobre la evolución y la genómica funcional de los tripanosomátidos .

Files

2023.07.17.549441.full.pdf.pdf

Files (9.8 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:dd8ca1ce54d537d930436a380d80c82a
9.8 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
تجميع الجينوم شبه الكامل والمرحلي لسلالة<i> المثقبية الكروزية</i> الكولومبية TcI وتطور عائلات الجينات
Translated title (French)
Un assemblage génomique presque complet et progressif d'une souche de<i> Trypanosoma cruzi</i>TcI colombien et l'évolution des familles de gènes
Translated title (Spanish)
Un ensamblaje del genoma casi completo y en fases de una cepa colombiana de<i> Trypanosoma cruzi</i>TcI y la evolución de las familias de genes

Identifiers

Other
https://openalex.org/W4384829753
DOI
10.1101/2023.07.17.549441

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Colombia

References

  • https://openalex.org/W1487554690
  • https://openalex.org/W1600203421
  • https://openalex.org/W1916919897
  • https://openalex.org/W1972043575
  • https://openalex.org/W1986103093
  • https://openalex.org/W1986912398
  • https://openalex.org/W1996423252
  • https://openalex.org/W1996600059
  • https://openalex.org/W1997480045
  • https://openalex.org/W2006102383
  • https://openalex.org/W2006717294
  • https://openalex.org/W2028867134
  • https://openalex.org/W2034325006
  • https://openalex.org/W2037147698
  • https://openalex.org/W2039031773
  • https://openalex.org/W2040756306
  • https://openalex.org/W2041836042
  • https://openalex.org/W2052293721
  • https://openalex.org/W2059981817
  • https://openalex.org/W2060624730
  • https://openalex.org/W2061246349
  • https://openalex.org/W2061723281
  • https://openalex.org/W2065240060
  • https://openalex.org/W2065510307
  • https://openalex.org/W2076886235
  • https://openalex.org/W2077936217
  • https://openalex.org/W2080413629
  • https://openalex.org/W2090948051
  • https://openalex.org/W2102357774
  • https://openalex.org/W2103065322
  • https://openalex.org/W2104465006
  • https://openalex.org/W2107772251
  • https://openalex.org/W2110335151
  • https://openalex.org/W2112479590
  • https://openalex.org/W2121616578
  • https://openalex.org/W2126934950
  • https://openalex.org/W2127315472
  • https://openalex.org/W2132551264
  • https://openalex.org/W2147526198
  • https://openalex.org/W2147830249
  • https://openalex.org/W2150491437
  • https://openalex.org/W2154883726
  • https://openalex.org/W2155159495
  • https://openalex.org/W2158804744
  • https://openalex.org/W2165891191
  • https://openalex.org/W2169307994
  • https://openalex.org/W2172105162
  • https://openalex.org/W2252498187
  • https://openalex.org/W2556533107
  • https://openalex.org/W2757157006
  • https://openalex.org/W2772365387
  • https://openalex.org/W2789843538
  • https://openalex.org/W2792476365
  • https://openalex.org/W2892379493
  • https://openalex.org/W2900632171
  • https://openalex.org/W2942828116
  • https://openalex.org/W2951164187
  • https://openalex.org/W2954668533
  • https://openalex.org/W3004755070
  • https://openalex.org/W3017049640
  • https://openalex.org/W3029749314
  • https://openalex.org/W3036231717
  • https://openalex.org/W3092213157
  • https://openalex.org/W3121123811
  • https://openalex.org/W3121742446
  • https://openalex.org/W3125532839
  • https://openalex.org/W3131055609
  • https://openalex.org/W3134317746
  • https://openalex.org/W3140504176
  • https://openalex.org/W3173655749
  • https://openalex.org/W3194975773
  • https://openalex.org/W4200564640
  • https://openalex.org/W4213284346
  • https://openalex.org/W4236236547
  • https://openalex.org/W4306809799
  • https://openalex.org/W4309026660
  • https://openalex.org/W4376255607