Published July 29, 2013 | Version v1
Publication Open

Genomic Treasure Troves: Complete Genome Sequencing of Herbarium and Insect Museum Specimens

  • 1. Maastricht University
  • 2. Utrecht University
  • 3. Naturalis Biodiversity Center
  • 4. Leiden University Medical Center
  • 5. Westerdijk Fungal Biodiversity Institute
  • 6. Royal Botanic Garden Edinburgh
  • 7. Universidad de Los Andes

Description

Unlocking the vast genomic diversity stored in natural history collections would create unprecedented opportunities for genome-scale evolutionary, phylogenetic, domestication and population genomic studies. Many researchers have been discouraged from using historical specimens in molecular studies because of both generally limited success of DNA extraction and the challenges associated with PCR-amplifying highly degraded DNA. In today's next-generation sequencing (NGS) world, opportunities and prospects for historical DNA have changed dramatically, as most NGS methods are actually designed for taking short fragmented DNA molecules as templates. Here we show that using a standard multiplex and paired-end Illumina sequencing approach, genome-scale sequence data can be generated reliably from dry-preserved plant, fungal and insect specimens collected up to 115 years ago, and with minimal destructive sampling. Using a reference-based assembly approach, we were able to produce the entire nuclear genome of a 43-year-old Arabidopsis thaliana (Brassicaceae) herbarium specimen with high and uniform sequence coverage. Nuclear genome sequences of three fungal specimens of 22-82 years of age (Agaricus bisporus, Laccaria bicolor, Pleurotus ostreatus) were generated with 81.4-97.9% exome coverage. Complete organellar genome sequences were assembled for all specimens. Using de novo assembly we retrieved between 16.2-71.0% of coding sequence regions, and hence remain somewhat cautious about prospects for de novo genome assembly from historical specimens. Non-target sequence contaminations were observed in 2 of our insect museum specimens. We anticipate that future museum genomics projects will perhaps not generate entire genome sequences in all cases (our specimens contained relatively small and low-complexity genomes), but at least generating vital comparative genomic data for testing (phylo)genetic, demographic and genetic hypotheses, that become increasingly more horizontal. Furthermore, NGS of historical DNA enables recovering crucial genetic information from old type specimens that to date have remained mostly unutilized and, thus, opens up a new frontier for taxonomic research as well.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

إن فتح التنوع الجيني الهائل المخزن في مجموعات التاريخ الطبيعي من شأنه أن يخلق فرصًا غير مسبوقة للدراسات الجينية التطورية على نطاق الجينوم، والتطور، والتدجين، والجينوم السكاني. تم تثبيط العديد من الباحثين عن استخدام العينات التاريخية في الدراسات الجزيئية بسبب النجاح المحدود عمومًا لاستخراج الحمض النووي والتحديات المرتبطة بتضخيم تفاعل البوليميراز المتسلسل للحمض النووي شديد التدهور. في عالم التسلسل من الجيل التالي (NGS) اليوم، تغيرت فرص وآفاق الحمض النووي التاريخي بشكل كبير، حيث تم تصميم معظم طرق الحمض النووي في الواقع لأخذ جزيئات الحمض النووي المجزأة القصيرة كقوالب. نوضح هنا أنه باستخدام نهج تسلسل إلومينا القياسي المتعدد والمزدوج، يمكن توليد بيانات التسلسل على نطاق الجينوم بشكل موثوق من عينات النباتات والفطريات والحشرات المحفوظة جافًا التي تم جمعها منذ ما يصل إلى 115 عامًا، ومع الحد الأدنى من أخذ العينات المدمرة. باستخدام نهج التجميع القائم على المرجع، تمكنا من إنتاج الجينوم النووي بأكمله لعينة أعشاب عربيدوبسيس ثاليانا (Brassicaceae) البالغة من العمر 43 عامًا بتغطية تسلسلية عالية وموحدة. تم إنشاء تسلسلات الجينوم النووي لثلاث عينات فطرية تتراوح أعمارهم بين 22 و 82 عامًا (Agaricus bisporus، Laccaria bicolor، Pleurotus ostreatus) بتغطية إكسوم 81.4-97.9 ٪. تم تجميع تسلسلات الجينوم العضوي الكاملة لجميع العينات. باستخدام تجميع de novo، استرجعنا ما بين 16.2-71.0 ٪ من مناطق تسلسل الترميز، وبالتالي ظللنا حذرين إلى حد ما بشأن احتمالات تجميع جينوم de novo من العينات التاريخية. ولوحظت حالات تلوث متسلسلة غير مستهدفة في عينتين من عينات متحف الحشرات لدينا. نتوقع أن مشاريع علم الجينوم في المتاحف المستقبلية ربما لن تولد تسلسلات جينوم كاملة في جميع الحالات (تحتوي عيناتنا على جينومات صغيرة نسبيًا ومنخفضة التعقيد)، ولكن على الأقل توليد بيانات جينومية مقارنة حيوية لاختبار الفرضيات الجينية والديموغرافية والجينية (النباتية)، والتي تصبح أفقية بشكل متزايد. علاوة على ذلك، تمكن NGS للحمض النووي التاريخي من استعادة المعلومات الوراثية الحاسمة من العينات القديمة التي ظلت حتى الآن غير مستخدمة في الغالب، وبالتالي تفتح حدودًا جديدة للبحث التصنيفي أيضًا.

Translated Description (French)

Libérer la vaste diversité génomique stockée dans les collections d'histoire naturelle créerait des opportunités sans précédent pour les études génomiques évolutives, phylogénétiques, de domestication et de génomique des populations à l'échelle du génome. De nombreux chercheurs ont été découragés d'utiliser des spécimens historiques dans des études moléculaires en raison du succès généralement limité de l'extraction de l'ADN et des défis associés à l'amplification par PCR de l'ADN hautement dégradé. Dans le monde actuel du séquençage de nouvelle génération (NGS), les opportunités et les perspectives de l'ADN historique ont considérablement changé, car la plupart des méthodes NGS sont en fait conçues pour prendre de courtes molécules d'ADN fragmentées comme modèles. Ici, nous montrons qu'en utilisant une approche standard de séquençage d'Illumina multiplex et à extrémité appariée, les données de séquence à l'échelle du génome peuvent être générées de manière fiable à partir de spécimens de plantes, de champignons et d'insectes conservés à sec collectés il y a jusqu'à 115 ans, et avec un échantillonnage destructif minimal. En utilisant une approche d'assemblage basée sur des références, nous avons pu produire le génome nucléaire entier d'un spécimen d'herbier Arabidopsis thaliana (Brassicaceae) âgé de 43 ans avec une couverture de séquence élevée et uniforme. Des séquences génomiques nucléaires de trois spécimens fongiques âgés de 22 à 82 ans (Agaricus bisporus, Laccaria bicolor, Pleurotus ostreatus) ont été générées avec une couverture exomique de 81,4 à 97,9 %. Des séquences complètes du génome organellaire ont été assemblées pour tous les spécimens. En utilisant l'assemblage de novo, nous avons récupéré entre 16,2 et 71,0 % des régions de séquences codantes, et restons donc quelque peu prudents quant aux perspectives d'assemblage du génome de novo à partir de spécimens historiques. Des contaminations de séquences non ciblées ont été observées dans 2 de nos spécimens de musée d'insectes. Nous prévoyons que les futurs projets de génomique muséale ne généreront peut-être pas des séquences génomiques entières dans tous les cas (nos spécimens contenaient des génomes relativement petits et de faible complexité), mais au moins généreront des données génomiques comparatives vitales pour tester (phylo) des hypothèses génétiques, démographiques et génétiques, qui deviennent de plus en plus horizontales. En outre, la NGS d'ADN historique permet de récupérer des informations génétiques cruciales à partir de spécimens de type ancien qui, à ce jour, sont restés pour la plupart inutilisés et, par conséquent, ouvre également une nouvelle frontière pour la recherche taxonomique.

Translated Description (Spanish)

Desbloquear la vasta diversidad genómica almacenada en las colecciones de historia natural crearía oportunidades sin precedentes para estudios genómicos evolutivos, filogenéticos, de domesticación y de población a escala del genoma. Se ha disuadido a muchos investigadores de utilizar especímenes históricos en estudios moleculares debido tanto al éxito generalmente limitado de la extracción de ADN como a los desafíos asociados con la amplificación por PCR de ADN altamente degradado. En el mundo actual de la secuenciación de próxima generación (NGS), las oportunidades y perspectivas para el ADN histórico han cambiado drásticamente, ya que la mayoría de los métodos de NGS están diseñados para tomar moléculas de ADN fragmentadas cortas como plantillas. Aquí mostramos que utilizando un enfoque estándar de secuenciación de Illumina múltiplex y de extremos emparejados, los datos de la secuencia a escala del genoma se pueden generar de manera confiable a partir de especímenes de plantas, hongos e insectos conservados en seco recolectados hasta hace 115 años, y con un muestreo destructivo mínimo. Utilizando un enfoque de ensamblaje basado en referencias, pudimos producir todo el genoma nuclear de un espécimen de herbario de Arabidopsis thaliana (Brassicaceae) de 43 años con una cobertura de secuencia alta y uniforme. Se generaron secuencias genómicas nucleares de tres especímenes fúngicos de 22-82 años de edad (Agaricus bisporus, Laccaria bicolor, Pleurotus ostreatus) con una cobertura del exoma del 81,4-97,9%. Se ensamblaron secuencias completas del genoma del orgánulo para todas las muestras. Utilizando el ensamblaje de novo, recuperamos entre el 16,2 y el 71,0% de las regiones de la secuencia codificante y, por lo tanto, seguimos siendo algo cautelosos sobre las perspectivas de ensamblaje del genoma de novo a partir de especímenes históricos. Se observaron contaminaciones de secuencias no objetivo en 2 de nuestros especímenes de museo de insectos. Anticipamos que los futuros proyectos de genómica de museos tal vez no generarán secuencias genómicas completas en todos los casos (nuestros especímenes contenían genomas relativamente pequeños y de baja complejidad), pero al menos generarán datos genómicos comparativos vitales para probar hipótesis (filogenéticas)genéticas, demográficas y genéticas, que se vuelven cada vez más horizontales. Además, el NGS de ADN histórico permite recuperar información genética crucial de especímenes de tipo antiguo que hasta la fecha han permanecido en su mayoría sin utilizar y, por lo tanto, también abre una nueva frontera para la investigación taxonómica.

Files

journal.pone.0069189&type=printable.pdf

Files (200.4 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:d289fd92d2aabeb6eae155f8d1117382
200.4 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
ثروات الكنز الجيني: تسلسل الجينوم الكامل لعينات متحف الأعشاب والحشرات
Translated title (French)
Trésors génomiques : séquençage complet du génome des spécimens d'herbiers et de musées d'insectes
Translated title (Spanish)
Tesoros Genómicos: Secuenciación Genómica Completa de Especímenes de Herbario y Museo de Insectos

Identifiers

Other
https://openalex.org/W1967080197
DOI
10.1371/journal.pone.0069189

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Colombia

References

  • https://openalex.org/W1820419916
  • https://openalex.org/W1966262033
  • https://openalex.org/W1979185805
  • https://openalex.org/W1980111026
  • https://openalex.org/W1996439449
  • https://openalex.org/W1999057382
  • https://openalex.org/W1999469035
  • https://openalex.org/W2006167115
  • https://openalex.org/W2028858659
  • https://openalex.org/W2039959586
  • https://openalex.org/W2050660384
  • https://openalex.org/W2060367467
  • https://openalex.org/W2066289589
  • https://openalex.org/W2070821333
  • https://openalex.org/W2071510336
  • https://openalex.org/W2076657512
  • https://openalex.org/W2078608034
  • https://openalex.org/W2079478438
  • https://openalex.org/W2083952240
  • https://openalex.org/W2086381437
  • https://openalex.org/W2096557606
  • https://openalex.org/W2102619694
  • https://openalex.org/W2103283541
  • https://openalex.org/W2107282968
  • https://openalex.org/W2108234281
  • https://openalex.org/W2110375946
  • https://openalex.org/W2113634873
  • https://openalex.org/W2122393312
  • https://openalex.org/W2122719918
  • https://openalex.org/W2124985265
  • https://openalex.org/W2127735379
  • https://openalex.org/W2133500135
  • https://openalex.org/W2134590897
  • https://openalex.org/W2135581989
  • https://openalex.org/W2136145671
  • https://openalex.org/W2136826997
  • https://openalex.org/W2137893283
  • https://openalex.org/W2142014575
  • https://openalex.org/W2142274926
  • https://openalex.org/W2142360438
  • https://openalex.org/W2143319834
  • https://openalex.org/W2150637445
  • https://openalex.org/W2156330112
  • https://openalex.org/W2160910964
  • https://openalex.org/W2160969485
  • https://openalex.org/W2167692076
  • https://openalex.org/W2168864305
  • https://openalex.org/W2169585666
  • https://openalex.org/W2172296101