Sequencing Introduced False Positive Rare Taxa Lead to Distorted Microbial Community Diversity, Assembly, and Interaction Interpretation in Amplicon Studies
Creators
- 1. BGI Group (China)
- 2. Institute of Animal Sciences
- 3. Chinese Academy of Agricultural Sciences
- 4. Shandong University
- 5. Hong Kong Baptist University
- 6. University of Copenhagen
Description
Abstract BackgroundDue to the inherent scarcity of the microbial rare taxa, it is difficult to distinguish between bona fide rare taxa and potential false positives in metabarcoding amplicon sequencing studies. Although recently developed quality control and clustering or denoising algorithms could remove sequencing errors or non-biological artifact reads, no algorithm could remove high quality reads from sample-wise cross contaminations introduced by index misassignment. ResultsWe thoroughly evaluated the rate of index misassignment of the mostly used NovaSeq 6000 and DNBSEQ-G400 sequencing platforms using both commercial and customized mock communities, and observed significant higher (5.68% vs 0.08%) fraction of potential false positive reads for NovaSeq 6000 compared to DNBSEQ-G400 in. Significant batch effects could be caused by the randomly detected false positive or false negative rare taxa. These false detections introduced by index misassignment could also lead to inflated alpha diversity for relatively simple samples while underestimated alpha diversity for complex samples. Further test using a set of cow rumen samples reported differential rare taxa by different sequencing platforms. Correlation test of the rare taxa detected by each sequencing platform demonstrated that the Novaseq 6000 platform detected rare taxa had a much lower possibility to be correlated with the physiochemical properties of rumen fluid. Community assembly mechanism and microbial network association analysis indicated that false positive or negative rare taxa detection could lead to distorted community assembly process and identification of even fake keystone species of the community, one of which was confirmed negative by PCR cloning and following Sanger sequencing. ConclusionsMetabarcoding amplicon sequencing process may introduce scarce but not neglectable false positives. We highly suggest proper positive and negative controls and technical replicate settings, and proper sequencing platform selection in future amplicon studies, especially when the microbial rare biosphere should be focused.
Translated Descriptions
Translated Description (Arabic)
خلفية مجردة بسبب الندرة المتأصلة في الأصناف النادرة الميكروبية، من الصعب التمييز بين الأصناف النادرة الحسنة النية والإيجابيات الكاذبة المحتملة في دراسات تسلسل الأمبليكون الفوقية. على الرغم من أن خوارزميات مراقبة الجودة وتجميع أو إزالة التشويش التي تم تطويرها مؤخرًا يمكن أن تزيل أخطاء التسلسل أو قراءات الأدوات غير البيولوجية، إلا أنه لا توجد خوارزمية يمكن أن تزيل قراءات عالية الجودة من الملوثات المتقاطعة للعينة التي تم إدخالها عن طريق سوء تخصيص الفهرس. النتائج قمنا بتقييم دقيق لمعدل سوء تخصيص المؤشر لمنصات التسلسل NovaSeq 6000 و DNBSEQ - G400 المستخدمة في الغالب باستخدام كل من المجتمعات الوهمية التجارية والمخصصة، ولاحظنا نسبة أعلى بكثير (5.68 ٪ مقابل 0.08 ٪) من القراءات الإيجابية الخاطئة المحتملة لـ NovaSeq 6000 مقارنة بـ DNBSEQ - G400 في عام. يمكن أن تحدث تأثيرات دفعية كبيرة بسبب الأصناف الإيجابية الخاطئة أو السلبية الخاطئة النادرة المكتشفة عشوائيًا. يمكن أن تؤدي هذه الاكتشافات الخاطئة التي أدخلها سوء تخصيص المؤشر أيضًا إلى تضخم تنوع ألفا للعينات البسيطة نسبيًا مع التقليل من تنوع ألفا للعينات المعقدة. تم إجراء المزيد من الاختبارات باستخدام مجموعة من عينات كرش البقر التي أبلغت عن أصناف نادرة تفاضلية بواسطة منصات تسلسل مختلفة. أظهر اختبار الارتباط للأصناف النادرة التي اكتشفتها كل منصة تسلسل أن منصة نوفاسيك 6000 اكتشفت أن الأصناف النادرة لديها إمكانية أقل بكثير للارتباط بالخصائص الفيزيائية الكيميائية لسائل الكرش. أشارت آلية التجميع المجتمعي وتحليل ارتباط الشبكة الميكروبية إلى أن اكتشاف الأصناف النادرة الإيجابية أو السلبية الخاطئة يمكن أن يؤدي إلى عملية تجميع مجتمعية مشوهة وتحديد حتى الأنواع الرئيسية المزيفة في المجتمع، والتي تم تأكيد أحدها سلبيًا من خلال استنساخ تفاعل البوليميراز المتسلسل واتباع تسلسل سانجر. الاستنتاجات: قد تؤدي عملية تسلسل الأمبليكون الميتاباركود إلى ظهور نتائج إيجابية خاطئة نادرة ولكن لا يمكن إهمالها. نقترح بشدة الضوابط الإيجابية والسلبية المناسبة وإعدادات النسخ المتماثل الفنية، واختيار منصة التسلسل المناسبة في دراسات الأمبليكون المستقبلية، خاصة عندما يجب التركيز على المحيط الحيوي النادر الميكروبي.Translated Description (French)
Résumé ContexteEn raison de la rareté inhérente des taxons rares microbiens, il est difficile de faire la distinction entre les taxons rares de bonne foi et les faux positifs potentiels dans les études de séquençage de l'amplicon de métabarcodage. Bien que des algorithmes de contrôle de la qualité et de regroupement ou de débruitage récemment développés puissent supprimer les erreurs de séquençage ou les lectures d'artefacts non biologiques, aucun algorithme ne pouvait supprimer les lectures de haute qualité des contaminations croisées par échantillonnage introduites par une mauvaise attribution d'index. RésultatsNous avons soigneusement évalué le taux de mauvaise attribution d'index des plates-formes de séquençage NovaSeq 6000 et DNBSEQ-G400 les plus utilisées à l'aide de communautés fictives commerciales et personnalisées, et avons observé une fraction significativement plus élevée (5,68 % contre 0,08 %) de lectures potentielles de faux positifs pour NovaSeq 6000 par rapport à DNBSEQ-G400 en. Des effets de lot significatifs pourraient être causés par les taxons rares faussement positifs ou faussement négatifs détectés au hasard. Ces fausses détections introduites par une mauvaise attribution d'indice pourraient également conduire à une diversité alpha gonflée pour des échantillons relativement simples alors qu'une diversité alpha sous-estimée pour des échantillons complexes. Des tests supplémentaires utilisant un ensemble d'échantillons de rumen de vache ont rapporté des taxons rares différentiels par différentes plates-formes de séquençage. Le test de corrélation des taxons rares détectés par chaque plate-forme de séquençage a démontré que la plate-forme Novaseq 6000 détectée des taxons rares avait une possibilité beaucoup plus faible d'être corrélée avec les propriétés physiochimiques du liquide de rumen. Le mécanisme d'assemblage de la communauté et l'analyse de l'association du réseau microbien ont indiqué que la détection de taxons rares faux positifs ou négatifs pourrait entraîner une distorsion du processus d'assemblage de la communauté et l'identification même de fausses espèces clés de la communauté, dont l'une a été confirmée négative par le clonage par PCR et le séquençage de Sanger. ConclusionsLe processus de séquençage de l'amplicon par le métabarcodage peut introduire des faux positifs rares mais non négligeables. Nous suggérons fortement des contrôles positifs et négatifs appropriés et des paramètres de réplication technique, ainsi qu'une sélection appropriée de la plate-forme de séquençage dans les futures études d'amplicon, en particulier lorsque la biosphère microbienne rare doit être ciblée.Translated Description (Spanish)
Antecedentes abstractosDebido a la escasez inherente de los taxones raros microbianos, es difícil distinguir entre taxones raros de buena fe y posibles falsos positivos en los estudios de secuenciación de amplicones de metabarcodificación. Aunque los algoritmos de control de calidad y agrupamiento o eliminación de ruido desarrollados recientemente podrían eliminar los errores de secuenciación o las lecturas de artefactos no biológicos, ningún algoritmo podría eliminar las lecturas de alta calidad de las contaminaciones cruzadas por muestra introducidas por la asignación incorrecta del índice. ResultadosEvaluamos a fondo la tasa de asignación incorrecta del índice de las plataformas de secuenciación NovaSeq 6000 y DNBSEQ-G400 más utilizadas utilizando comunidades simuladas comerciales y personalizadas, y observamos una fracción significativamente mayor (5,68% frente a 0,08%) de posibles lecturas de falsos positivos para NovaSeq 6000 en comparación con DNBSEQ-G400 en. Los efectos significativos del lote podrían ser causados por los taxones raros falsos positivos o falsos negativos detectados aleatoriamente. Estas falsas detecciones introducidas por la mala asignación de índices también podrían conducir a una diversidad alfa inflada para muestras relativamente simples, mientras que la diversidad alfa subestimada para muestras complejas. Pruebas adicionales utilizando un conjunto de muestras de rumen de vaca informaron taxones raros diferenciales por diferentes plataformas de secuenciación. La prueba de correlación de los taxones raros detectados por cada plataforma de secuenciación demostró que la plataforma Novaseq 6000 detectó taxones raros con una posibilidad mucho menor de correlacionarse con las propiedades fisicoquímicas del fluido ruminal. El mecanismo de ensamblaje comunitario y el análisis de la asociación de redes microbianas indicaron que la detección de taxones raros falsos positivos o negativos podría conducir a un proceso de ensamblaje comunitario distorsionado y a la identificación de incluso especies clave falsas de la comunidad, una de las cuales se confirmó negativa mediante clonación por PCR y después de la secuenciación de Sanger. ConclusionesEl proceso de secuenciación de amplicones de Metabarcoding puede introducir falsos positivos escasos pero no despreciables. Sugerimos encarecidamente controles positivos y negativos adecuados y configuraciones técnicas repetidas, y una selección adecuada de la plataforma de secuenciación en futuros estudios de amplicones, especialmente cuando se debe enfocar la biosfera microbiana rara.Files
latest.pdf.pdf
Files
(4.5 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:699ef42112811c051026257a22387d08
|
4.5 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- يؤدي تسلسل الأصناف النادرة الإيجابية الكاذبة المقدمة إلى تنوع المجتمع الميكروبي المشوه وتجميعه وتفسير التفاعل في دراسات الأمبليكون
- Translated title (French)
- Le séquençage a introduit des taxons rares faussement positifs conduisant à une diversité, un assemblage et une interprétation de l'interaction de la communauté microbienne déformés dans les études Amplicon
- Translated title (Spanish)
- La secuenciación de taxones raros falsos positivos introducidos conduce a la diversidad de la comunidad microbiana distorsionada, el ensamblaje y la interpretación de la interacción en los estudios de amplicones
Identifiers
- Other
- https://openalex.org/W4226058523
- DOI
- 10.21203/rs.3.rs-965102/v2