Published February 1, 2013 | Version v1
Publication Open

Allele Identification for Transcriptome-Based Population Genomics in the Invasive Plant<i>Centaurea solstitialis</i>

  • 1. University of British Columbia
  • 2. University of Arizona
  • 3. Indiana University Bloomington
  • 4. Universidad Nacional de La Pampa
  • 5. Consejo Nacional de Investigaciones Científicas y Técnicas

Description

Transcriptome sequences are becoming more broadly available for multiple individuals of the same species, providing opportunities to derive population genomic information from these datasets. Using the 454 Life Science Genome Sequencer FLX and FLX-Titanium next-generation platforms, we generated 11-430 Mbp of sequence for normalized cDNA for 40 wild genotypes of the invasive plant Centaurea solstitialis, yellow starthistle, from across its worldwide distribution. We examined the impact of sequencing effort on transcriptome recovery and overlap among individuals. To do this, we developed two novel publicly available software pipelines: SnoWhite for read cleaning before assembly, and AllelePipe for clustering of loci and allele identification in assembled datasets with or without a reference genome. AllelePipe is designed specifically for cases in which read depth information is not appropriate or available to assist with disentangling closely related paralogs from allelic variation, as in transcriptome or previously assembled libraries. We find that modest applications of sequencing effort recover most of the novel sequences present in the transcriptome of this species, including single-copy loci and a representative distribution of functional groups. In contrast, the coverage of variable sites, observation of heterozygosity, and overlap among different libraries are all highly dependent on sequencing effort. Nevertheless, the information gained from overlapping regions was informative regarding coarse population structure and variation across our small number of population samples, providing the first genetic evidence in support of hypothesized invasion scenarios.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

أصبحت متواليات الترانسكريبتوم متاحة على نطاق أوسع للعديد من الأفراد من نفس النوع، مما يوفر فرصًا لاستخلاص المعلومات الجينية السكانية من مجموعات البيانات هذه. باستخدام 454 Life Science Genome Sequencer FLX و FLX - Titanium الجيل التالي من المنصات، أنشأنا 11-430 ميغابت في الثانية من التسلسل لـ cDNA الطبيعي لـ 40 نمطًا وراثيًا بريًا للنبات الغازي Centaurea solstitialis، الصافرة الصفراء، من جميع أنحاء توزيعها في جميع أنحاء العالم. درسنا تأثير جهد التسلسل على تعافي النسخ والتداخل بين الأفراد. للقيام بذلك، قمنا بتطوير خطي برمجيات جديدين متاحين للجمهور: SnoWhite لقراءة التنظيف قبل التجميع، و AllelePipe لتجميع تحديد المواقع والأليل في مجموعات البيانات المجمعة مع أو بدون جينوم مرجعي. تم تصميم AllelePipe خصيصًا للحالات التي تكون فيها معلومات عمق القراءة غير مناسبة أو متاحة للمساعدة في فك تشابك paralogs المرتبطة ارتباطًا وثيقًا من تباين الأليل، كما هو الحال في transcriptome أو المكتبات التي تم تجميعها مسبقًا. نجد أن التطبيقات المتواضعة لجهد التسلسل تستعيد معظم التسلسلات الجديدة الموجودة في ترانسكريبتوم هذا النوع، بما في ذلك مواضع النسخة الواحدة والتوزيع التمثيلي للمجموعات الوظيفية. في المقابل، تعتمد تغطية المواقع المتغيرة، ومراقبة تباين الزيجوت، والتداخل بين المكتبات المختلفة اعتمادًا كبيرًا على جهد التسلسل. ومع ذلك، كانت المعلومات المكتسبة من المناطق المتداخلة غنية بالمعلومات فيما يتعلق بالبنية السكانية الخشنة والاختلاف عبر عددنا الصغير من العينات السكانية، مما يوفر أول دليل وراثي يدعم سيناريوهات الغزو المفترضة.

Translated Description (French)

Les séquences transcriptomiques sont de plus en plus largement disponibles pour plusieurs individus de la même espèce, offrant la possibilité de dériver des informations génomiques de population à partir de ces ensembles de données. En utilisant les plateformes de nouvelle génération 454 Life Science Genome Sequencer FLX et FLX-Titanium, nous avons généré 11-430 Mbp de séquence pour l'ADNc normalisé pour 40 génotypes sauvages de la plante invasive Centaurea solstitialis, le chardon-étoile jaune, à travers sa distribution mondiale. Nous avons examiné l'impact de l'effort de séquençage sur la récupération du transcriptome et le chevauchement entre les individus. Pour ce faire, nous avons développé deux nouveaux pipelines logiciels accessibles au public : SnoWhite pour le nettoyage en lecture avant l'assemblage, et AllelePipe pour le regroupement des loci et l'identification des allèles dans des ensembles de données assemblés avec ou sans génome de référence. AllelePipe est conçu spécifiquement pour les cas où les informations de profondeur lues ne sont pas appropriées ou disponibles pour aider à démêler les paralogues étroitement liés de la variation allélique, comme dans le transcriptome ou les bibliothèques précédemment assemblées. Nous trouvons que des applications modestes de l'effort de séquençage récupèrent la plupart des nouvelles séquences présentes dans le transcriptome de cette espèce, y compris des loci à copie unique et une distribution représentative des groupes fonctionnels. En revanche, la couverture de sites variables, l'observation de l'hétérozygotie et le chevauchement entre différentes bibliothèques dépendent fortement de l'effort de séquençage. Néanmoins, les informations obtenues à partir de régions qui se chevauchent étaient instructives en ce qui concerne la structure et la variation grossières de la population dans notre petit nombre d'échantillons de population, fournissant les premières preuves génétiques à l'appui de scénarios d'invasion hypothétiques.

Translated Description (Spanish)

Las secuencias del transcriptoma están cada vez más disponibles para múltiples individuos de la misma especie, lo que brinda oportunidades para derivar información genómica de la población a partir de estos conjuntos de datos. Utilizando las plataformas de próxima generación 454 Life Science Genome Sequencer FLX y FLX-Titanium, generamos 11-430 Mbp de secuencia para ADNc normalizado para 40 genotipos silvestres de la planta invasora Centaurea solstitialis, cardo estrellado amarillo, de toda su distribución mundial. Examinamos el impacto del esfuerzo de secuenciación en la recuperación del transcriptoma y la superposición entre individuos. Para hacer esto, desarrollamos dos nuevos canales de software disponibles públicamente: SnoWhite para la limpieza de lectura antes del ensamblaje y AllelePipe para la agrupación de loci e identificación de alelos en conjuntos de datos ensamblados con o sin un genoma de referencia. AllelePipe está diseñado específicamente para casos en los que la información de profundidad de lectura no es apropiada o no está disponible para ayudar a desenredar parálogos estrechamente relacionados de la variación alélica, como en el transcriptoma o en bibliotecas previamente ensambladas. Encontramos que las aplicaciones modestas del esfuerzo de secuenciación recuperan la mayoría de las secuencias novedosas presentes en el transcriptoma de esta especie, incluidos los loci de una sola copia y una distribución representativa de grupos funcionales. Por el contrario, la cobertura de sitios variables, la observación de heterocigosidad y la superposición entre diferentes bibliotecas dependen en gran medida del esfuerzo de secuenciación. Sin embargo, la información obtenida de las regiones superpuestas fue informativa con respecto a la estructura gruesa de la población y la variación en nuestro pequeño número de muestras de población, proporcionando la primera evidencia genética en apoyo de los escenarios de invasión hipotéticos.

Files

g3journal0359.pdf.pdf

Files (93 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:b0d506893d4802090edf1644f5f082cd
93 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
تحديد الأليل لعلم الجينوم السكاني القائم على ترانسكريبتوم في النباتات الغازية<i> Centaurea solstitialis</i>
Translated title (French)
Identification des allèles pour la génomique des populations basée sur le transcriptome chez la plante invasive<i> Centaurea solstitialis</i>
Translated title (Spanish)
Identificación de alelos para la genómica de poblaciones basada en el transcriptoma en la planta invasora<i> Centaurea solstitialis</i>

Identifiers

Other
https://openalex.org/W2051120434
DOI
10.1534/g3.112.003871

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Argentina

References

  • https://openalex.org/W1527392350
  • https://openalex.org/W1858573497
  • https://openalex.org/W1890272012
  • https://openalex.org/W1963165726
  • https://openalex.org/W1976326910
  • https://openalex.org/W1980471868
  • https://openalex.org/W1981348283
  • https://openalex.org/W2014673667
  • https://openalex.org/W2015468210
  • https://openalex.org/W2019591778
  • https://openalex.org/W2024088441
  • https://openalex.org/W2033702613
  • https://openalex.org/W2036214473
  • https://openalex.org/W2037882155
  • https://openalex.org/W2041467022
  • https://openalex.org/W2041624900
  • https://openalex.org/W2055357051
  • https://openalex.org/W2063985242
  • https://openalex.org/W2068307424
  • https://openalex.org/W2073015979
  • https://openalex.org/W2085315239
  • https://openalex.org/W2086256956
  • https://openalex.org/W2092494859
  • https://openalex.org/W2095829109
  • https://openalex.org/W2098126593
  • https://openalex.org/W2099762535
  • https://openalex.org/W2100740664
  • https://openalex.org/W2100867243
  • https://openalex.org/W2103581172
  • https://openalex.org/W2105927944
  • https://openalex.org/W2107233609
  • https://openalex.org/W2107915254
  • https://openalex.org/W2108675597
  • https://openalex.org/W2110398029
  • https://openalex.org/W2112113834
  • https://openalex.org/W2114475493
  • https://openalex.org/W2120457919
  • https://openalex.org/W2121405020
  • https://openalex.org/W2121512231
  • https://openalex.org/W2123211219
  • https://openalex.org/W2124873881
  • https://openalex.org/W2128114769
  • https://openalex.org/W2131016694
  • https://openalex.org/W2131455728
  • https://openalex.org/W2133351051
  • https://openalex.org/W2134271628
  • https://openalex.org/W2138321803
  • https://openalex.org/W2139339918
  • https://openalex.org/W2141677788
  • https://openalex.org/W2142619120
  • https://openalex.org/W2148966488
  • https://openalex.org/W2149318232
  • https://openalex.org/W2150711660
  • https://openalex.org/W2155745416
  • https://openalex.org/W2158489424
  • https://openalex.org/W2158714788
  • https://openalex.org/W2160188176
  • https://openalex.org/W2161094791
  • https://openalex.org/W2161863335
  • https://openalex.org/W2162752272
  • https://openalex.org/W2166265186
  • https://openalex.org/W2168307546
  • https://openalex.org/W2168816336
  • https://openalex.org/W2169907253
  • https://openalex.org/W2171777347
  • https://openalex.org/W2247464968
  • https://openalex.org/W2470094722
  • https://openalex.org/W2582743722
  • https://openalex.org/W4285719527