Published June 28, 2023 | Version v1
Publication Open

Global analysis of the biosynthetic chemical space of marine prokaryotes

  • 1. Zhejiang University of Technology
  • 2. Yale University
  • 3. Second Institute of Oceanography
  • 4. Ministry of Natural Resources

Description

Abstract Background Marine prokaryotes are a rich source of novel bioactive secondary metabolites for drug discovery. Recent genome mining studies have revealed their great potential to bio-synthesize novel secondary metabolites. However, the exact biosynthetic chemical space encoded by the marine prokaryotes has yet to be systematically evaluated. Results We first investigated the secondary metabolic potential of marine prokaryotes by analyzing the diversity and novelty of the biosynthetic gene clusters (BGCs) in 7541 prokaryotic genomes from cultivated and single cells, along with 26,363 newly assembled medium-to-high-quality genomes from marine environmental samples. To quantitatively evaluate the unexplored biosynthetic chemical space of marine prokaryotes, the clustering thresholds for constructing the biosynthetic gene cluster and molecular networks were optimized to reach a similar level of the chemical similarity between the gene cluster family (GCF)-encoded metabolites and molecular family (MF) scaffolds using the MIBiG database. The global genome mining analysis demonstrated that the predicted 70,011 BGCs were organized into 24,536 mostly new (99.5%) GCFs, while the reported marine prokaryotic natural products were only classified into 778 MFs at the optimized clustering thresholds. The number of MF scaffolds is only 3.2% of the number of GCF-encoded scaffolds, suggesting that at least 96.8% of the secondary metabolic potential in marine prokaryotes is untapped. The unexplored biosynthetic chemical space of marine prokaryotes was illustrated by the 88 potential novel antimicrobial peptides encoded by ribosomally synthesized and post-translationally modified peptide BGCs. Furthermore, a sea-water-derived Aquimarina strain was selected to illustrate the diverse biosynthetic chemical space through untargeted metabolomics and genomics approaches, which identified the potential biosynthetic pathways of a group of novel polyketides and two known compounds (didemnilactone B and macrolactin A 15-ketone). Conclusions The present bioinformatics and cheminformatics analyses highlight the promising potential to explore the biosynthetic chemical diversity of marine prokaryotes and provide valuable knowledge for the targeted discovery and biosynthesis of novel marine prokaryotic natural products.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

بدائيات النوى البحرية هي مصدر غني للمستقلبات الثانوية النشطة بيولوجيًا الجديدة لاكتشاف الأدوية. كشفت دراسات تعدين الجينوم الحديثة عن إمكاناتها الكبيرة في التوليف الحيوي للمستقلبات الثانوية الجديدة. ومع ذلك، فإن الفضاء الكيميائي الحيوي الدقيق المشفر بواسطة بدائيات النوى البحرية لم يتم تقييمه بشكل منهجي بعد. النتائج لقد درسنا أولاً الإمكانات الأيضية الثانوية لبدائيات النوى البحرية من خلال تحليل تنوع وحداثة مجموعات الجينات الاصطناعية الحيوية (BGCs) في 7541 جينوم بدائيات النوى من الخلايا المزروعة والخلايا المفردة، إلى جانب 26363 جينومًا متوسط إلى عالي الجودة تم تجميعه حديثًا من عينات بيئية بحرية. للتقييم الكمي للفضاء الكيميائي الحيوي غير المستكشف لبدائيات النوى البحرية، تم تحسين عتبات التجميع لبناء مجموعة الجينات الحيوية والشبكات الجزيئية للوصول إلى مستوى مماثل من التشابه الكيميائي بين المستقلبات المشفرة لعائلة الجينات (GCF) وسقالات العائلة الجزيئية (MF) باستخدام قاعدة بيانات MIBiG. أظهر تحليل تعدين الجينوم العالمي أن 70,011 BGCs المتوقعة تم تنظيمها في 24,536 إطارًا عالميًا جديدًا (99.5 ٪)، في حين تم تصنيف المنتجات الطبيعية بدائية النواة البحرية المبلغ عنها فقط إلى 778 MFs عند عتبات التجميع المثلى. يبلغ عدد السقالات متعددة الوظائف 3.2 ٪ فقط من عدد السقالات المشفرة بإطار التعاون العالمي، مما يشير إلى أن 96.8 ٪ على الأقل من إمكانات الأيض الثانوية في بدائيات النوى البحرية غير مستغلة. تم توضيح الفضاء الكيميائي الحيوي غير المستكشف لبدائيات النوى البحرية من خلال 88 ببتيدًا مضادًا للميكروبات محتملًا مشفرًا بواسطة BGCs الريبوسومية التي تم تصنيعها وتعديلها بعد الترجمة. علاوة على ذلك، تم اختيار سلالة أكيمارينا المشتقة من مياه البحر لتوضيح الفضاء الكيميائي الحيوي المتنوع من خلال مناهج الأيض والجينوم غير المستهدفة، والتي حددت المسارات الحيوية المحتملة لمجموعة من البولي كيتيدات الجديدة ومركبين معروفين (ديديميلاكتون ب وماكرولاكتين أ 15 - كيتون). الاستنتاجات تسلط تحليلات المعلوماتية الحيوية والمعلوماتية الكيميائية الحالية الضوء على الإمكانات الواعدة لاستكشاف التنوع الكيميائي الحيوي لبدائيات النوى البحرية وتوفير معرفة قيمة للاكتشاف المستهدف والتركيب الحيوي للمنتجات الطبيعية البحرية بدائية النواة الجديدة.

Translated Description (French)

Résumé Contexte Les procaryotes marins sont une riche source de nouveaux métabolites secondaires bioactifs pour la découverte de médicaments. Des études récentes sur l'exploitation minière du génome ont révélé leur grand potentiel de biosynthèse de nouveaux métabolites secondaires. Cependant, l'espace chimique biosynthétique exact codé par les procaryotes marins n'a pas encore été systématiquement évalué. Résultats Nous avons d'abord étudié le potentiel métabolique secondaire des procaryotes marins en analysant la diversité et la nouveauté des groupes de gènes biosynthétiques (BGC) dans 7541 génomes procaryotes de cellules cultivées et uniques, ainsi que 26 363 génomes de qualité moyenne à élevée nouvellement assemblés à partir d'échantillons environnementaux marins. Pour évaluer quantitativement l'espace chimique biosynthétique inexploré des procaryotes marins, les seuils de regroupement pour la construction du groupe de gènes biosynthétiques et des réseaux moléculaires ont été optimisés pour atteindre un niveau similaire de similitude chimique entre les métabolites codés par la famille des groupes de gènes (GCF) et les échafaudages de la famille moléculaire (MF) à l'aide de la base de données MIBiG. L'analyse mondiale de l'exploitation minière du génome a démontré que les 70 011 BGC prévus étaient organisés en 24 536 GCF principalement nouveaux (99,5 %), tandis que les produits naturels procaryotes marins signalés n'étaient classés en 778 MF qu'aux seuils de regroupement optimisés. Le nombre d'échafaudages MF n'est que de 3,2 % du nombre d'échafaudages codés par GCF, ce qui suggère qu'au moins 96,8 % du potentiel métabolique secondaire chez les procaryotes marins est inexploité. L'espace chimique biosynthétique inexploré des procaryotes marins a été illustré par les 88 nouveaux peptides antimicrobiens potentiels codés par des BGC peptidiques synthétisés ribosomiquement et modifiés post-traductionnellement. En outre, une souche Aquimarina dérivée de l'eau de mer a été sélectionnée pour illustrer la diversité de l'espace chimique biosynthétique par des approches métabolomiques et génomiques non ciblées, qui ont identifié les voies de biosynthèse potentielles d'un groupe de nouveaux polycétides et de deux composés connus (didemnilactone B et macrolactine A 15-cétone). Conclusions Les présentes analyses bioinformatiques et cheminformatiques mettent en évidence le potentiel prometteur d'exploration de la diversité chimique biosynthétique des procaryotes marins et fournissent des connaissances précieuses pour la découverte ciblée et la biosynthèse de nouveaux produits naturels procaryotes marins.

Translated Description (Spanish)

Resumen Antecedentes Los procariotas marinos son una rica fuente de nuevos metabolitos secundarios bioactivos para el descubrimiento de fármacos. Recientes estudios de minería del genoma han revelado su gran potencial para biosintetizar nuevos metabolitos secundarios. Sin embargo, el espacio químico biosintético exacto codificado por los procariotas marinos aún no se ha evaluado sistemáticamente. Resultados Primero investigamos el potencial metabólico secundario de los procariotas marinos analizando la diversidad y novedad de los grupos de genes biosintéticos (BGC) en 7541 genomas procariotas de células cultivadas y únicas, junto con 26,363 genomas de calidad media a alta recién ensamblados de muestras ambientales marinas. Para evaluar cuantitativamente el espacio químico biosintético inexplorado de procariotas marinos, se optimizaron los umbrales de agrupamiento para construir el grupo de genes biosintéticos y las redes moleculares para alcanzar un nivel similar de similitud química entre los metabolitos codificados por la familia de grupos de genes (GCF) y los andamios de la familia molecular (MF) utilizando la base de datos MIBiG. El análisis de la minería del genoma global demostró que las 70,011 BGC predichas se organizaron en 24,536 GCF en su mayoría nuevos (99.5%), mientras que los productos naturales procariotas marinos informados solo se clasificaron en 778 MF en los umbrales de agrupación optimizados. El número de andamios de MF es solo el 3,2% del número de andamios codificados por GCF, lo que sugiere que al menos el 96,8% del potencial metabólico secundario en procariotas marinos está sin explotar. El espacio químico biosintético inexplorado de los procariotas marinos se ilustró con los 88 nuevos péptidos antimicrobianos potenciales codificados por BGC peptídicas sintetizadas ribosómicamente y modificadas postraduccionalmente. Además, se seleccionó una cepa de Aquimarina derivada del agua de mar para ilustrar el diverso espacio químico biosintético a través de enfoques metabolómicos y genómicos no dirigidos, que identificaron las posibles vías biosintéticas de un grupo de policétidos novedosos y dos compuestos conocidos (didemnilactona B y macrolactina A 15-cetona). Conclusiones Los presentes análisis bioinformáticos y quimioinformáticos destacan el potencial prometedor para explorar la diversidad química biosintética de los procariotas marinos y proporcionar un conocimiento valioso para el descubrimiento y la biosíntesis específicos de nuevos productos naturales procariotas marinos.

Files

s40168-023-01573-3.pdf

Files (7.8 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:d0f5aebf7690ee775daea969a802e714
7.8 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
التحليل العالمي للفضاء الكيميائي الحيوي لبدائيات النوى البحرية
Translated title (French)
Analyse globale de l'espace chimique biosynthétique des procaryotes marins
Translated title (Spanish)
Análisis global del espacio químico biosintético de procariotas marinos

Identifiers

Other
https://openalex.org/W4382196044
DOI
10.1186/s40168-023-01573-3

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W1258349921
  • https://openalex.org/W1988037271
  • https://openalex.org/W1989299822
  • https://openalex.org/W2009257824
  • https://openalex.org/W2065386792
  • https://openalex.org/W2106579910
  • https://openalex.org/W2112364185
  • https://openalex.org/W2138793275
  • https://openalex.org/W2151697120
  • https://openalex.org/W2326996704
  • https://openalex.org/W2504691963
  • https://openalex.org/W2586644082
  • https://openalex.org/W2742084962
  • https://openalex.org/W2766193612
  • https://openalex.org/W2766239397
  • https://openalex.org/W2893437991
  • https://openalex.org/W2908219766
  • https://openalex.org/W2908998505
  • https://openalex.org/W2922522932
  • https://openalex.org/W2927961455
  • https://openalex.org/W2961626135
  • https://openalex.org/W2979713949
  • https://openalex.org/W2980832688
  • https://openalex.org/W2990471452
  • https://openalex.org/W2993327327
  • https://openalex.org/W2995063445
  • https://openalex.org/W2997918501
  • https://openalex.org/W3080789666
  • https://openalex.org/W3082380903
  • https://openalex.org/W3089574919
  • https://openalex.org/W3090121233
  • https://openalex.org/W3092124801
  • https://openalex.org/W3104596207
  • https://openalex.org/W3107629351
  • https://openalex.org/W3128515864
  • https://openalex.org/W3130092942
  • https://openalex.org/W3138252144
  • https://openalex.org/W3148202975
  • https://openalex.org/W3161596995
  • https://openalex.org/W3197817645
  • https://openalex.org/W3200854952
  • https://openalex.org/W3202642189
  • https://openalex.org/W3205459794
  • https://openalex.org/W3210489033
  • https://openalex.org/W4200175714
  • https://openalex.org/W4200524125
  • https://openalex.org/W4205900198
  • https://openalex.org/W4214943162
  • https://openalex.org/W4221115787
  • https://openalex.org/W4283262943
  • https://openalex.org/W4283688995
  • https://openalex.org/W4293261617