Chasing Sequencing Perfection: Marching Toward Higher Accuracy and Lower Costs
- 1. Institute of Zoology
- 2. Chinese Academy of Sciences
- 3. University of Chinese Academy of Sciences
Description
Abstract Next-generation sequencing (NGS), represented by Illumina platforms, has been an essential cornerstone of basic and applied research. However, the sequencing error rate of 1 per 1000 base pairs (10−3) represents a serious hurdle for research areas focusing on rare mutations, such as somatic mosaicism or microbe heterogeneity. By examining the high-fidelity sequencing methods developed in the past decade, we summarized three major factors underlying errors and the corresponding 12 strategies mitigating these errors. We then proposed a novel framework to classify 11 preexisting representative methods according to the corresponding combinatory strategies and identified 3 trends that emerged during methodological developments. We further extended this analysis to 8 long-read sequencing methods, emphasizing error reduction strategies. Finally, we suggest 2 promising future directions that could achieve comparable or even higher accuracy with lower costs in both NGS and long-read sequencing.
Translated Descriptions
Translated Description (Arabic)
كان تسلسل الجيل التالي (NGS)، الذي تمثله منصات إلومينا، حجر الزاوية الأساسي للبحوث الأساسية والتطبيقية. ومع ذلك، فإن معدل خطأ التسلسل البالغ 1 لكل 1000 زوج أساسي (10-3) يمثل عقبة خطيرة أمام مجالات البحث التي تركز على الطفرات النادرة، مثل الفسيفساء الجسدية أو عدم تجانس الميكروبات. من خلال فحص طرق التسلسل عالية الدقة التي تم تطويرها في العقد الماضي، قمنا بتلخيص ثلاثة عوامل رئيسية وراء الأخطاء والاستراتيجيات الـ 12 المقابلة التي تخفف من هذه الأخطاء. ثم اقترحنا إطارًا جديدًا لتصنيف 11 طريقة تمثيلية موجودة مسبقًا وفقًا للاستراتيجيات التجميعية المقابلة وحددنا 3 اتجاهات ظهرت أثناء التطورات المنهجية. كما وسعنا هذا التحليل ليشمل 8 طرق تسلسل طويلة القراءة، مع التركيز على استراتيجيات الحد من الأخطاء. أخيرًا، نقترح اتجاهين مستقبليين واعدين يمكنهما تحقيق دقة مماثلة أو أعلى بتكاليف أقل في كل من التسلسل غير الحكومي والتسلسل طويل القراءة.Translated Description (French)
Résumé Le séquençage de nouvelle génération (NGS), représenté par les plateformes Illumina, a été une pierre angulaire essentielle de la recherche fondamentale et appliquée. Cependant, le taux d'erreur de séquençage de 1 pour 1000 paires de bases (10−3) représente un obstacle sérieux pour les domaines de recherche axés sur les mutations rares, telles que le mosaïcisme somatique ou l'hétérogénéité microbienne. En examinant les méthodes de séquençage haute-fidélité développées au cours de la dernière décennie, nous avons résumé trois facteurs majeurs sous-jacents aux erreurs et les 12 stratégies correspondantes pour atténuer ces erreurs. Nous avons ensuite proposé un nouveau cadre pour classer 11 méthodes représentatives préexistantes selon les stratégies combinatoires correspondantes et identifié 3 tendances qui ont émergé au cours des développements méthodologiques. Nous avons étendu cette analyse à 8 méthodes de séquençage à long terme, en mettant l'accent sur les stratégies de réduction des erreurs. Enfin, nous suggérons 2 orientations futures prometteuses qui pourraient atteindre une précision comparable ou même supérieure avec des coûts inférieurs à la fois dans le séquençage NGS et à longue lecture.Translated Description (Spanish)
Resumen La secuenciación de próxima generación (NGS), representada por las plataformas Illumina, ha sido una piedra angular esencial de la investigación básica y aplicada. Sin embargo, la tasa de error de secuenciación de 1 por cada 1000 pares de bases (10−3) representa un serio obstáculo para las áreas de investigación que se centran en mutaciones raras, como el mosaicismo somático o la heterogeneidad microbiana. Al examinar los métodos de secuenciación de alta fidelidad desarrollados en la última década, resumimos tres factores principales subyacentes a los errores y las 12 estrategias correspondientes para mitigar estos errores. A continuación, propusimos un marco novedoso para clasificar 11 métodos representativos preexistentes de acuerdo con las estrategias combinatorias correspondientes e identificamos 3 tendencias que surgieron durante los desarrollos metodológicos. Ampliamos aún más este análisis a 8 métodos de secuenciación de lectura larga, enfatizando las estrategias de reducción de errores. Finalmente, sugerimos 2 direcciones futuras prometedoras que podrían lograr una precisión comparable o incluso mayor con menores costos tanto en NGS como en la secuenciación de lectura larga.Files
      
        qzae024.pdf.pdf
        
      
    
    
      
        Files
         (93 Bytes)
        
      
    
    | Name | Size | Download all | 
|---|---|---|
| md5:b0d506893d4802090edf1644f5f082cd | 93 Bytes | Preview Download | 
Additional details
Additional titles
- Translated title (Arabic)
- مطاردة الكمال التسلسلي: السير نحو دقة أعلى وتكاليف أقل
- Translated title (French)
- Poursuivre la perfection du séquençage : Marcher vers une plus grande précision et des coûts plus bas
- Translated title (Spanish)
- Persiguiendo la perfección de la secuenciación: avanzando hacia una mayor precisión y menores costes
Identifiers
- Other
- https://openalex.org/W4392637479
- DOI
- 10.1093/gpbjnl/qzae024