Published February 1, 2021 | Version v1
Publication Open

A Gapless, Unambiguous RNA Metagenome-Assembled Genome Sequence of a Unique SARS-CoV-2 Variant Encoding Spike S813I and ORF1a A859V Substitutions

  • 1. Cairo University
  • 2. Cairo University hospitals

Description

The novel severe acute respiratory syndrome corona virus 2 (SARS-CoV-2) is causing an unprecedented pandemic, threatening planetary health, society, and economy. Genomic surveillance continues to be a critical effort toward tracking the virus and containing its spread, and more genomes from diverse geographical areas and different time points are needed to provide an appropriate representation of the virus evolution. In this study, we report the successful assembly of one single gapless, unambiguous contiguous sequence representing the complete viral genome from a nasopharyngeal swab of an infected health care worker in Cairo, Egypt. The sequence has all typical features of SARS-CoV-2 genomes, with no protein-disrupting mutations. However, three mutations are worth highlighting and future tracking: a synonymous mutation causing a rare spike S813I variation and two less frequent ones leading to an A41V variation in NSP3, encoded by ORF1a (ORF1a A895V), and a Q677H variation in the spike protein. Both affected proteins, S and NSP3, are relevant to vaccine and drug development. Although the genome, named CU_S3, belongs to the prevalent global genotype, marked by the D614G spike variation, the combined variations in the spike proteins and ORF1a do not co-occur in any of the 197,000 genomes reported to date. Future studies will assess the biological, pathogenic, and epidemiological implications of this set of genetic variations. This line of research is needed to inform vaccine and therapeutic innovation to stem the COVID-19 pandemic.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يتسبب فيروس كورونا 2 الجديد المرتبط بالمتلازمة التنفسية الحادة الوخيمة (SARS - CoV -2) في جائحة غير مسبوقة، مما يهدد صحة الكوكب والمجتمع والاقتصاد. لا تزال المراقبة الجينية تمثل جهدًا حاسمًا نحو تتبع الفيروس واحتواء انتشاره، وهناك حاجة إلى المزيد من الجينومات من مناطق جغرافية متنوعة ونقاط زمنية مختلفة لتوفير تمثيل مناسب لتطور الفيروس. في هذه الدراسة، نبلغ عن التجميع الناجح لتسلسل واحد واحد متجاور لا لبس فيه يمثل الجينوم الفيروسي الكامل من مسحة بلعومية أنفية لعامل رعاية صحية مصاب في القاهرة، مصر. يحتوي التسلسل على جميع السمات النموذجية لجينوم سارس- كوف-2، مع عدم وجود طفرات تعطل البروتين. ومع ذلك، هناك ثلاث طفرات تستحق تسليط الضوء عليها وتتبعها في المستقبل: طفرة مرادفة تسبب تباينًا نادرًا في S813I واثنان أقل تكرارًا يؤديان إلى تباين A41V في NSP3، مشفر بواسطة ORF1a (ORF1a A895V)، وتباين Q677H في بروتين السنبلة. كلا البروتينين المتضررين، S و NSP3، لهما صلة بتطوير اللقاحات والأدوية. على الرغم من أن الجينوم، المسمى CU_S3، ينتمي إلى النمط الجيني العالمي السائد، والذي يتميز بتباين D614G spike، فإن الاختلافات المجمعة في بروتينات spike و ORF1a لا تحدث في أي من الجينوم البالغ 197000 الذي تم الإبلاغ عنه حتى الآن. ستقيّم الدراسات المستقبلية الآثار البيولوجية والمسببة للأمراض والوبائية لهذه المجموعة من الاختلافات الجينية. هناك حاجة إلى هذا الخط من البحث لإبلاغ اللقاح والابتكار العلاجي لوقف جائحة كوفيد-19.

Translated Description (French)

Le nouveau virus corona 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) provoque une pandémie sans précédent, menaçant la santé, la société et l'économie de la planète. La surveillance génomique continue d'être un effort essentiel pour suivre le virus et contenir sa propagation, et davantage de génomes provenant de diverses zones géographiques et de différents points de temps sont nécessaires pour fournir une représentation appropriée de l'évolution du virus. Dans cette étude, nous rapportons l'assemblage réussi d'une seule séquence contiguë sans lacune et sans ambiguïté représentant le génome viral complet à partir d'un écouvillon nasopharyngé d'un agent de santé infecté au Caire, en Égypte. La séquence présente toutes les caractéristiques typiques des génomes du SRAS-CoV-2, sans mutations perturbant les protéines. Cependant, trois mutations méritent d'être mises en évidence et suivies à l'avenir : une mutation synonyme provoquant une variation rare du spike S813I et deux mutations moins fréquentes conduisant à une variation A41V de NSP3, codée par ORF1a (ORF1a A895V), et une variation Q677H de la protéine spike. Les deux protéines affectées, S et NSP3, sont pertinentes pour le développement de vaccins et de médicaments. Bien que le génome, nommé CU_S3, appartienne au génotype global prévalent, marqué par la variation de pointe D614G, les variations combinées des protéines de pointe et de l'ORF1a ne coexistent dans aucun des 197 000 génomes rapportés à ce jour. Les futures études évalueront les implications biologiques, pathogènes et épidémiologiques de cet ensemble de variations génétiques. Cette ligne de recherche est nécessaire pour éclairer l'innovation vaccinale et thérapeutique afin d'endiguer la pandémie de COVID-19.

Translated Description (Spanish)

El nuevo coronavirus 2 del síndrome respiratorio agudo severo (SARS-CoV-2) está causando una pandemia sin precedentes, amenazando la salud, la sociedad y la economía del planeta. La vigilancia genómica sigue siendo un esfuerzo crítico para rastrear el virus y contener su propagación, y se necesitan más genomas de diversas áreas geográficas y diferentes puntos temporales para proporcionar una representación adecuada de la evolución del virus. En este estudio, informamos sobre el ensamblaje exitoso de una sola secuencia contigua sin huecos e inequívoca que representa el genoma viral completo de un hisopo nasofaríngeo de un trabajador de la salud infectado en El Cairo, Egipto. La secuencia tiene todas las características típicas de los genomas del SARS-CoV-2, sin mutaciones que alteren las proteínas. Sin embargo, vale la pena destacar tres mutaciones y un seguimiento futuro: una mutación sinónima que causa una variación rara del pico S813I y dos menos frecuentes que conducen a una variación A41V en NSP3, codificada por ORF1a (ORF1a A895V), y una variación Q677H en la proteína pico. Ambas proteínas afectadas, S y NSP3, son relevantes para el desarrollo de vacunas y fármacos. Aunque el genoma, denominado CU_S3, pertenece al genotipo global prevalente, marcado por la variación del pico D614G, las variaciones combinadas en las proteínas del pico y ORF1a no coexisten en ninguno de los 197.000 genomas informados hasta la fecha. Los estudios futuros evaluarán las implicaciones biológicas, patógenas y epidemiológicas de este conjunto de variaciones genéticas. Esta línea de investigación es necesaria para informar la vacuna y la innovación terapéutica para frenar la pandemia de COVID-19.

Files

latest.pdf.pdf

Files (3.0 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:0f3b963f0ae149a31e1fcc6c459fbb5b
3.0 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
سلسلة جينوم مجمعة خالية من الفجوات ولا لبس فيها من الحمض النووي الريبي Metagenome لبدائل ترميز متغير سارس- كوف-2 S813I و ORF1a A859V الفريدة
Translated title (French)
Une séquence de génome assemblé avec un métagénome d'ARN sans ambiguïté et sans lacune d'une variante unique du SRAS-CoV-2 codant pour les substitutions Spike S813I et ORF1a A859V
Translated title (Spanish)
Una secuencia genómica ensamblada al metagenoma de ARN sin huecos e inequívoca de una variante única del SARS-CoV-2 que codifica las sustituciones de los picos S813I y ORF1a A859V

Identifiers

Other
https://openalex.org/W3109456382
DOI
10.1089/omi.2020.0194

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Egypt

References

  • https://openalex.org/W1519266993
  • https://openalex.org/W2031611770
  • https://openalex.org/W2105329815
  • https://openalex.org/W2108982334
  • https://openalex.org/W2120902911
  • https://openalex.org/W2132926880
  • https://openalex.org/W2142678478
  • https://openalex.org/W2470646526
  • https://openalex.org/W2952045272
  • https://openalex.org/W3014051579
  • https://openalex.org/W3022231104
  • https://openalex.org/W3032675634
  • https://openalex.org/W3035920796
  • https://openalex.org/W3039352801
  • https://openalex.org/W3039901154
  • https://openalex.org/W3040158341
  • https://openalex.org/W3043124965
  • https://openalex.org/W3091599686
  • https://openalex.org/W3093768302
  • https://openalex.org/W3095413302