Cotton D genome assemblies built with long-read data unveil mechanisms of centromere evolution and stress tolerance divergence
Creators
- 1. Zhengzhou University
- 2. Hunan University
- 3. Chinese Academy of Agricultural Sciences
- 4. National University of Defense Technology
Description
Many of genome features which could help unravel the often complex post-speciation evolution of closely related species are obscured because of their location in chromosomal regions difficult to accurately characterize using standard genome analysis methods, including centromeres and repeat regions.Here, we analyze the genome evolution and diversification of two recently diverged sister cotton species based on nanopore long-read sequence assemblies and Hi-C 3D genome data. Although D genomes are conserved in gene content, they have diversified in gene order, gene structure, gene family diversification, 3D chromatin structure, long-range regulation, and stress-related traits. Inversions predominate among D genome rearrangements. Our results support roles for 5mC and 6mA in gene activation, and 3D chromatin analysis showed that diversification in proximal-vs-distal regulatory-region interactions shape the regulation of defense-related-gene expression. Using a newly developed method, we accurately positioned cotton centromeres and found that these regions have undergone obviously more rapid evolution relative to chromosome arms. We also discovered a cotton-specific LTR class that clarifies evolutionary trajectories among diverse cotton species and identified genetic networks underlying the Verticillium tolerance of Gossypium thurberi (e.g., SA signaling) and salt-stress tolerance of Gossypium davidsonii (e.g., ethylene biosynthesis). Finally, overexpression of G. thurberi genes in upland cotton demonstrated how wild cottons can be exploited for crop improvement.Our study substantially deepens understanding about how centromeres have developed and evolutionarily impacted the divergence among closely related cotton species and reveals genes and 3D genome structures which can guide basic investigations and applied efforts to improve crops.
Translated Descriptions
Translated Description (Arabic)
يتم حجب العديد من ميزات الجينوم التي يمكن أن تساعد في كشف التطور المعقد في كثير من الأحيان بعد الأنواع ذات الصلة الوثيقة بسبب موقعها في مناطق الكروموسومات التي يصعب توصيفها بدقة باستخدام طرق تحليل الجينوم القياسية، بما في ذلك القسيمات المركزية والمناطق المتكررة. هنا، نقوم بتحليل تطور الجينوم وتنوع اثنين من أنواع القطن الشقيقة المتباينة مؤخرًا بناءً على تجمعات تسلسل النانو طويلة المدى وبيانات الجينوم ثلاثية الأبعاد عالية الدقة. على الرغم من أن الجينوم D محفوظ في المحتوى الجيني، إلا أنه تنوع في ترتيب الجينات، والبنية الجينية، وتنويع عائلة الجينات، وبنية الكروماتين ثلاثية الأبعاد، والتنظيم طويل المدى، والسمات المرتبطة بالإجهاد. تسود الانقلابات بين إعادة ترتيب الجينوم D. تدعم نتائجنا أدوار 5mC و 6mA في تنشيط الجينات، وأظهر تحليل الكروماتين ثلاثي الأبعاد أن التنويع في التفاعلات بين المناطق التنظيمية القريبة مقابل المناطق البعيدة يشكل تنظيم التعبير الجيني المرتبط بالدفاع. باستخدام طريقة مطورة حديثًا، وضعنا القسيمات المركزية القطنية بدقة ووجدنا أن هذه المناطق شهدت تطورًا أسرع بشكل واضح بالنسبة لأذرع الكروموسومات. اكتشفنا أيضًا فئة LTR خاصة بالقطن توضح المسارات التطورية بين أنواع القطن المتنوعة وحددنا الشبكات الوراثية الكامنة وراء تحمل فيرتيسيليوم لجوسيبيوم ثوربيري (على سبيل المثال، إشارات SA) وتحمل الإجهاد الملحي لجوسيبيوم دافيدسونى (على سبيل المثال، التخليق الحيوي للإيثيلين). أخيرًا، أظهر التعبير المفرط عن جينات G. thurberi في قطن المرتفعات كيف يمكن استغلال الأقطان البرية لتحسين المحاصيل. تعمل دراستنا على تعميق الفهم بشكل كبير حول كيفية تطور القسيمات المركزية وتأثيرها التطوري على الاختلاف بين أنواع القطن وثيقة الصلة وتكشف عن الجينات وهياكل الجينوم ثلاثية الأبعاد التي يمكن أن توجه التحقيقات الأساسية والجهود التطبيقية لتحسين المحاصيل.Translated Description (French)
De nombreuses caractéristiques du génome qui pourraient aider à démêler l'évolution post-spécification souvent complexe d'espèces étroitement apparentées sont obscurcies en raison de leur emplacement dans des régions chromosomiques difficiles à caractériser avec précision à l'aide de méthodes d'analyse génomique standard, y compris les centromères et les régions de répétition. Ici, nous analysons l'évolution et la diversification du génome de deux espèces de coton sœurs récemment divergentes sur la base d'assemblages de séquences à lecture longue nanopore et de données génomiques 3D Hi-C. Bien que les génomes D soient conservés dans le contenu des gènes, ils se sont diversifiés dans l'ordre des gènes, la structure des gènes, la diversification de la famille des gènes, la structure de la chromatine 3D, la régulation à long terme et les traits liés au stress. Les inversions prédominent parmi les réarrangements du génome D. Nos résultats soutiennent les rôles de 5mC et 6mA dans l'activation des gènes, et l'analyse de la chromatine 3D a montré que la diversification des interactions proximales-vs-distales entre les régions régulatrices façonne la régulation de l'expression des gènes liés à la défense. En utilisant une méthode nouvellement développée, nous avons positionné avec précision les centromères du coton et constaté que ces régions ont subi une évolution évidemment plus rapide par rapport aux bras chromosomiques. Nous avons également découvert une classe LTR spécifique au coton qui clarifie les trajectoires évolutives parmi diverses espèces de coton et identifié les réseaux génétiques sous-jacents à la tolérance à Verticillium de Gossypium thurberi (par exemple, la signalisation SA) et à la tolérance au stress salin de Gossypium davidsonii (par exemple, la biosynthèse de l'éthylène). Enfin, la surexpression des gènes de G. thurberi dans le coton des hautes terres a démontré comment les cotons sauvages peuvent être exploités pour l'amélioration des cultures. Notre étude approfondit considérablement la compréhension de la façon dont les centromères se sont développés et ont eu un impact évolutif sur la divergence entre les espèces de coton étroitement apparentées et révèle des gènes et des structures génomiques 3D qui peuvent guider les enquêtes de base et les efforts appliqués pour améliorer les cultures.Translated Description (Spanish)
Muchas de las características del genoma que podrían ayudar a desentrañar la a menudo compleja evolución posterior a la especiación de especies estrechamente relacionadas se oscurecen debido a su ubicación en regiones cromosómicas difíciles de caracterizar con precisión utilizando métodos estándar de análisis del genoma, incluidos los centrómeros y las regiones de repetición. Aquí, analizamos la evolución del genoma y la diversificación de dos especies de algodón hermanas recientemente divergidas basadas en ensamblajes de secuencias de lectura larga de nanoporos y datos del genoma Hi-C 3D. Aunque los genomas D se conservan en contenido génico, se han diversificado en orden de genes, estructura génica, diversificación de familias de genes, estructura de cromatina 3D, regulación de largo alcance y rasgos relacionados con el estrés. Las inversiones predominan entre los reordenamientos del genoma D. Nuestros resultados respaldan los roles de 5mC y 6mA en la activación génica, y el análisis de cromatina en 3D mostró que la diversificación en las interacciones de la región reguladora proximal frente a la distal da forma a la regulación de la expresión génica relacionada con la defensa. Usando un método recientemente desarrollado, posicionamos con precisión los centrómeros de algodón y descubrimos que estas regiones han experimentado una evolución obviamente más rápida en relación con los brazos cromosómicos. También descubrimos una clase de LTR específica del algodón que aclara las trayectorias evolutivas entre diversas especies de algodón e identificamos redes genéticas subyacentes a la tolerancia a Verticillium de Gossypium thurberi (por ejemplo, señalización SA) y la tolerancia al estrés salino de Gossypium davidsonii (por ejemplo, biosíntesis de etileno). Finalmente, la sobreexpresión de genes de G. thurberi en algodón de tierras altas demostró cómo se pueden explotar los algodones silvestres para mejorar los cultivos. Nuestro estudio profundiza sustancialmente la comprensión sobre cómo los centrómeros se han desarrollado e impactado evolutivamente en la divergencia entre especies de algodón estrechamente relacionadas y revela genes y estructuras genómicas 3D que pueden guiar las investigaciones básicas y los esfuerzos aplicados para mejorar los cultivos.Files
s12915-021-01041-0.pdf
Files
(3.6 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:e94e147cf85d0512ef43b04a753148c9
|
3.6 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- تكشف تجميعات جينوم القطن D المبنية ببيانات طويلة القراءة عن آليات تطور القسيم المركزي وتباعد تحمل الإجهاد
- Translated title (French)
- Les assemblages du génome D du coton construits avec des données lues à long terme dévoilent les mécanismes de l'évolution des centromères et de la divergence de la tolérance au stress
- Translated title (Spanish)
- Los ensamblajes del genoma del algodón D construidos con datos de lectura larga revelan mecanismos de evolución del centrómero y divergencia de tolerancia al estrés
Identifiers
- Other
- https://openalex.org/W3165784772
- DOI
- 10.1186/s12915-021-01041-0
References
- https://openalex.org/W1506603736
- https://openalex.org/W1546952499
- https://openalex.org/W1903350925
- https://openalex.org/W1903370796
- https://openalex.org/W1963957860
- https://openalex.org/W1976182511
- https://openalex.org/W1982855075
- https://openalex.org/W2008856488
- https://openalex.org/W2009873257
- https://openalex.org/W2014005472
- https://openalex.org/W2014677321
- https://openalex.org/W2017698319
- https://openalex.org/W2020134788
- https://openalex.org/W2030530458
- https://openalex.org/W2080063168
- https://openalex.org/W2080477348
- https://openalex.org/W2086399100
- https://openalex.org/W2093776734
- https://openalex.org/W2103441770
- https://openalex.org/W2107177914
- https://openalex.org/W2108108770
- https://openalex.org/W2118970626
- https://openalex.org/W2121840477
- https://openalex.org/W2128476271
- https://openalex.org/W2136145671
- https://openalex.org/W2139134537
- https://openalex.org/W2141572089
- https://openalex.org/W2148076194
- https://openalex.org/W2159368494
- https://openalex.org/W2160636499
- https://openalex.org/W2166187656
- https://openalex.org/W2167737093
- https://openalex.org/W2175830921
- https://openalex.org/W2185693210
- https://openalex.org/W2485621458
- https://openalex.org/W2510875395
- https://openalex.org/W2546606203
- https://openalex.org/W2788588748
- https://openalex.org/W2790251212
- https://openalex.org/W2792034759
- https://openalex.org/W2800524954
- https://openalex.org/W2896055880
- https://openalex.org/W2897312477
- https://openalex.org/W2900679305
- https://openalex.org/W2901898638
- https://openalex.org/W2902012935
- https://openalex.org/W2941072767
- https://openalex.org/W2941885741
- https://openalex.org/W2948863695
- https://openalex.org/W2949867654
- https://openalex.org/W2950141703
- https://openalex.org/W2950354111
- https://openalex.org/W2951434717
- https://openalex.org/W2952763207
- https://openalex.org/W2954970901
- https://openalex.org/W2956955330
- https://openalex.org/W2969760455
- https://openalex.org/W2970917079
- https://openalex.org/W2971820238
- https://openalex.org/W3002661013
- https://openalex.org/W3008861312
- https://openalex.org/W3009188792
- https://openalex.org/W3015258461
- https://openalex.org/W3016732089
- https://openalex.org/W3047959744
- https://openalex.org/W4232644640
- https://openalex.org/W4250613417