Published May 6, 2024 | Version v1
Publication Open

Teaching transposon classification as a means to crowd source the curation of repeat annotation – a tardigrade perspective

  • 1. Uppsala University
  • 2. University of Bologna
  • 3. New York University Abu Dhabi
  • 4. Skolkovo Institute of Science and Technology
  • 5. University of Oslo
  • 6. Anglia Ruskin University
  • 7. University of Arizona
  • 8. Leibniz Institute for Zoo and Wildlife Research
  • 9. Reed College
  • 10. University of Chicago
  • 11. University of Freiburg
  • 12. Helmholtz Zentrum München
  • 13. Royal Botanic Gardens, Kew
  • 14. University of Tübingen
  • 15. Czech Academy of Sciences, Institute of Botany
  • 16. University of Warsaw
  • 17. Magyar Agrár- és Élettudományi Egyetem
  • 18. Institute of Genetics
  • 19. Natural History Museum
  • 20. King Abdullah University of Science and Technology
  • 21. LOEWE Centre for Translational Biodiversity Genomics
  • 22. University College London
  • 23. Charles University
  • 24. University of Liège
  • 25. University of Zurich
  • 26. DKFZ-ZMBH Alliance
  • 27. German Cancer Research Center
  • 28. Museo Nacional de Ciencias Naturales
  • 29. National Institute of Technology Durgapur
  • 30. Water Research Institute
  • 31. National Research Council
  • 32. Eurofins (Germany)
  • 33. ETH Zurich
  • 34. Wellcome Sanger Institute
  • 35. Jagannath University
  • 36. Institute of Hydrobiology, Biology Centre, Academy of Sciences of the Czech Republic
  • 37. Czech Academy of Sciences
  • 38. University of Jyväskylä
  • 39. Centogene (Germany)
  • 40. University of California, Los Angeles
  • 41. TU Dresden
  • 42. University of East Anglia
  • 43. Norwich Research Park

Description

Abstract Background The advancement of sequencing technologies results in the rapid release of hundreds of new genome assemblies a year providing unprecedented resources for the study of genome evolution. Within this context, the significance of in-depth analyses of repetitive elements, transposable elements (TEs) in particular, is increasingly recognized in understanding genome evolution. Despite the plethora of available bioinformatic tools for identifying and annotating TEs, the phylogenetic distance of the target species from a curated and classified database of repetitive element sequences constrains any automated annotation effort. Moreover, manual curation of raw repeat libraries is deemed essential due to the frequent incompleteness of automatically generated consensus sequences. Results Here, we present an example of a crowd-sourcing effort aimed at curating and annotating TE libraries of two non-model species built around a collaborative, peer-reviewed teaching process. Manual curation and classification are time-consuming processes that offer limited short-term academic rewards and are typically confined to a few research groups where methods are taught through hands-on experience. Crowd-sourcing efforts could therefore offer a significant opportunity to bridge the gap between learning the methods of curation effectively and empowering the scientific community with high-quality, reusable repeat libraries. Conclusions The collaborative manual curation of TEs from two tardigrade species, for which there were no TE libraries available, resulted in the successful characterization of hundreds of new and diverse TEs in a reasonable time frame. Our crowd-sourcing setting can be used as a teaching reference guide for similar projects: A hidden treasure awaits discovery within non-model organisms.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

خلفية مجردة يؤدي تقدم تقنيات التسلسل إلى الإطلاق السريع لمئات من تجميعات الجينوم الجديدة سنويًا مما يوفر موارد غير مسبوقة لدراسة تطور الجينوم. في هذا السياق، يتم التعرف بشكل متزايد على أهمية التحليلات المتعمقة للعناصر المتكررة، والعناصر القابلة للنقل (TEs) على وجه الخصوص، في فهم تطور الجينوم. على الرغم من وجود عدد كبير من الأدوات المعلوماتية الحيوية المتاحة لتحديد وتعليق TEs، فإن المسافة الوراثية للأنواع المستهدفة من قاعدة بيانات منظمة ومصنفة لتسلسلات العناصر المتكررة تقيد أي جهد آلي للتعليق التوضيحي. علاوة على ذلك، يعتبر التنظيم اليدوي لمكتبات التكرار الأولية ضروريًا بسبب عدم الاكتمال المتكرر لتسلسلات الإجماع التي يتم إنشاؤها تلقائيًا. النتائج هنا، نقدم مثالاً على جهد التعهيد الجماعي الذي يهدف إلى تنسيق وتعليق مكتبات التعليم الفني على نوعين غير نموذجيين مبنيين حول عملية تعليمية تعاونية خاضعة لمراجعة الأقران. التنظيم اليدوي والتصنيف هي عمليات تستغرق وقتًا طويلاً تقدم مكافآت أكاديمية محدودة على المدى القصير وتقتصر عادةً على عدد قليل من مجموعات البحث حيث يتم تدريس الأساليب من خلال الخبرة العملية. لذلك يمكن أن توفر جهود التعهيد الجماعي فرصة كبيرة لسد الفجوة بين تعلم طرق التنظيم بفعالية وتمكين المجتمع العلمي بمكتبات متكررة عالية الجودة وقابلة لإعادة الاستخدام. الاستنتاجات أدى التنظيم اليدوي التعاوني لـ TEs من نوعين من بطيئي التدرج، والتي لم تكن هناك مكتبات TE متاحة لها، إلى التوصيف الناجح لمئات من TEs الجديدة والمتنوعة في إطار زمني معقول. يمكن استخدام إعداد التعهيد الجماعي الخاص بنا كدليل مرجعي تعليمي لمشاريع مماثلة: كنز مخفي ينتظر الاكتشاف داخل الكائنات الحية غير النموذجية.

Translated Description (French)

Résumé Contexte L'avancement des technologies de séquençage se traduit par la libération rapide de centaines de nouveaux assemblages génomiques par an, fournissant des ressources sans précédent pour l'étude de l'évolution du génome. Dans ce contexte, l'importance des analyses approfondies des éléments répétitifs, en particulier des éléments transposables (ET), est de plus en plus reconnue dans la compréhension de l'évolution du génome. Malgré la pléthore d'outils bioinformatiques disponibles pour identifier et annoter les ET, la distance phylogénétique des espèces cibles à partir d'une base de données organisée et classée de séquences d'éléments répétitifs limite tout effort d'annotation automatisé. De plus, la curation manuelle des bibliothèques de répétitions brutes est jugée essentielle en raison de l'incomplétude fréquente des séquences de consensus générées automatiquement. Résultats Nous présentons ici un exemple d'effort de crowdsourcing visant à organiser et annoter des bibliothèques TE de deux espèces non modèles construites autour d'un processus d'enseignement collaboratif et évalué par des pairs. La conservation et la classification manuelles sont des processus chronophages qui offrent des récompenses académiques à court terme limitées et sont généralement limités à quelques groupes de recherche où les méthodes sont enseignées par le biais d'une expérience pratique. Les efforts de crowdsourcing pourraient donc offrir une occasion importante de combler le fossé entre l'apprentissage efficace des méthodes de conservation et l'autonomisation de la communauté scientifique avec des bibliothèques de répétition réutilisables de haute qualité. Conclusions La conservation manuelle collaborative des ET de deux espèces tardigrade, pour lesquelles il n'y avait pas de bibliothèques d'ET disponibles, a permis de caractériser avec succès des centaines d'ET nouvelles et diverses dans un délai raisonnable. Notre cadre de crowdsourcing peut être utilisé comme guide de référence pédagogique pour des projets similaires : un trésor caché attend d'être découvert au sein d'organismes non modèles.

Translated Description (Spanish)

Antecedentes abstractos El avance de las tecnologías de secuenciación da como resultado la rápida liberación de cientos de nuevos ensamblajes de genoma al año, lo que proporciona recursos sin precedentes para el estudio de la evolución del genoma. En este contexto, la importancia de los análisis en profundidad de los elementos repetitivos, en particular los elementos transponibles (TE), se reconoce cada vez más en la comprensión de la evolución del genoma. A pesar de la gran cantidad de herramientas bioinformáticas disponibles para identificar y anotar TE, la distancia filogenética de las especies objetivo de una base de datos curada y clasificada de secuencias de elementos repetitivos limita cualquier esfuerzo de anotación automatizado. Además, la curación manual de las bibliotecas de repetición sin procesar se considera esencial debido al frecuente carácter incompleto de las secuencias de consenso generadas automáticamente. Resultados Aquí, presentamos un ejemplo de un esfuerzo de crowd-sourcing destinado a curar y anotar bibliotecas de TE de dos especies no modelo construidas en torno a un proceso de enseñanza colaborativo y revisado por pares. La curación y clasificación manuales son procesos que consumen mucho tiempo y que ofrecen recompensas académicas limitadas a corto plazo y, por lo general, se limitan a unos pocos grupos de investigación donde los métodos se enseñan a través de la experiencia práctica. Por lo tanto, los esfuerzos de crowdsourcing podrían ofrecer una oportunidad significativa para cerrar la brecha entre aprender los métodos de curación de manera efectiva y empoderar a la comunidad científica con bibliotecas de repetición reutilizables y de alta calidad. Conclusiones La curación manual colaborativa de TE de dos especies de tardígrados, para las que no había bibliotecas de TE disponibles, resultó en la caracterización exitosa de cientos de TE nuevos y diversos en un marco de tiempo razonable. Nuestro entorno de crowdsourcing se puede utilizar como una guía de referencia de enseñanza para proyectos similares: un tesoro escondido espera ser descubierto dentro de organismos no modelo.

Files

s13100-024-00319-8.pdf

Files (3.2 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:365eb3643419546b2fca0c8e1295fa2d
3.2 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
تدريس تصنيف الترانسبوسون كوسيلة للحشد مصدر تنظيم التعليقات التوضيحية المتكررة – منظور بطيء التدرج
Translated title (French)
Enseigner la classification des transposons comme moyen de rassembler la curation de l'annotation répétée – une perspective tardive
Translated title (Spanish)
Enseñar la clasificación de transposones como un medio para la fuente colectiva de la curación de la anotación repetida: una perspectiva de tardígrado

Identifiers

Other
https://openalex.org/W4396675761
DOI
10.1186/s13100-024-00319-8

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Bangladesh

References

  • https://openalex.org/W1482190741
  • https://openalex.org/W2001671544
  • https://openalex.org/W2004589024
  • https://openalex.org/W2037993016
  • https://openalex.org/W2059864757
  • https://openalex.org/W2070424199
  • https://openalex.org/W2083697678
  • https://openalex.org/W2085708372
  • https://openalex.org/W2104789942
  • https://openalex.org/W2120249349
  • https://openalex.org/W2142466527
  • https://openalex.org/W2142678478
  • https://openalex.org/W2143450601
  • https://openalex.org/W2144362290
  • https://openalex.org/W2154812648
  • https://openalex.org/W2259812802
  • https://openalex.org/W2587213787
  • https://openalex.org/W2596963838
  • https://openalex.org/W2746799972
  • https://openalex.org/W2751583588
  • https://openalex.org/W2769734892
  • https://openalex.org/W2937200409
  • https://openalex.org/W2949551779
  • https://openalex.org/W2950121380
  • https://openalex.org/W2950218595
  • https://openalex.org/W2951464304
  • https://openalex.org/W2991012415
  • https://openalex.org/W2995727696
  • https://openalex.org/W3005235420
  • https://openalex.org/W3017049640
  • https://openalex.org/W3021840362
  • https://openalex.org/W3023115273
  • https://openalex.org/W3031763224
  • https://openalex.org/W3084790560
  • https://openalex.org/W3133711058
  • https://openalex.org/W3172383629
  • https://openalex.org/W3174474386
  • https://openalex.org/W4221023376
  • https://openalex.org/W4225117037
  • https://openalex.org/W4281951612
  • https://openalex.org/W4292239814
  • https://openalex.org/W4367173711
  • https://openalex.org/W4386167402
  • https://openalex.org/W4386918199
  • https://openalex.org/W4393991132