Published December 1, 2023 | Version v1
Publication

Whole genome sequence and annotation dataset of rare actinobacteria, Barrientosiimonas humi gen. nov., sp. nov. 39T from Antarctica

  • 1. Universiti Putra Malaysia
  • 2. National Cancer Council Malaysia

Description

Barrientosiimonas humi gen. nov., sp. nov. 39T is a rare actinobacteria strain isolated from the less explored extreme environment of the Antarctic soil. Here, we present the whole genome sequencing and annotation data from the high-quality draft genome of B. humi from Antarctica. The extracted genomic deoxyribonucleic acid (DNA) was sequenced using the PacBio Sequel sequencing platform, followed by the Illumina HiSeq sequencing system. Subsequently, the assembly data from Canu 1.7 and Pilon were subjected to bioinformatics analysis for genome annotation to analyze the entire genomic information of the sequences. Different bioinformatics analysis approaches were used to disclose a high-quality draft genome basis for B. humi and provided a better understanding of its biological and molecular functions. Note that 83,639 reads were predicted from its 3.6Mb genome size, with a guanine-cytosine content (GC) content of 72.39%. The genome was assembled into two contigs, where the larger contig represents the chromosome and the smaller contig represents the plasmid. It is composed of 3,381 coding genes, with about 95% of them being functionally annotated. It consists of 3,318 coding sequences, one tmRNA gene, 57 tRNA genes, and five repeated regions. B. humi was evident, sharing a close sequence similarity with the species Demetria terragena and the family Dermacoccaceae. Gene Ontology (GO) functional classification indicated cell and cell parts were highly represented among the cellular component category; catalytic activity and binding were the most enriched processes within the molecular function category; metabolic and cellular processes were the most represented in the biological process category. Clusters of Orthologous Group (COG) functional classification revealed metabolism-related genes were highly enriched and mostly mapped to amino acid transport metabolism, transcription, energy production, and conversion. Moreover, the Kyoto Encyclopedia of Genes and Genomes (KEGG) functional classification reported that the metabolism process was the most represented KEGG pathway. There were 52 biosynthetic gene clusters involved in secondary metabolites biosynthesis, indicating B. humi has antibacterial, antifungal, cytotoxic, and inhibitor bioactivities. The dataset of the whole-genome sequence of B. humi has been deposited in the European Nucleotide Archive (ENA) repository under the accession number PRJEB44986 / ERP129097. The dataset of the genome annotation of B. humi had been deposited in Zenodo. The reported genomic sequence data for B. humi contributes comprehensive data to the current molecular information of the species, serving as a significant approach that facilitates the advancement of medicine.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

Barrientosiimonas humi gen. nov.، sp. nov. 39T هي سلالة شعاعية نادرة معزولة عن البيئة المتطرفة الأقل استكشافًا في تربة القارة القطبية الجنوبية. هنا، نقدم تسلسل الجينوم الكامل وبيانات التعليقات التوضيحية من مسودة الجينوم عالية الجودة لـ B. humi من القارة القطبية الجنوبية. تم تسلسل حمض الديوكسي ريبونوكليك الجيني المستخرج (DNA) باستخدام منصة تسلسل PacBio Sequel، متبوعًا بنظام تسلسل Illumina HiSeq. في وقت لاحق، خضعت بيانات التجميع من Canu 1.7 و Pilon لتحليل المعلوماتية الحيوية للتعليق التوضيحي للجينوم لتحليل المعلومات الجينية الكاملة للتسلسلات. تم استخدام مناهج تحليل المعلوماتية الحيوية المختلفة للكشف عن أساس جينوم مسودة عالية الجودة لـ B. HUMI ووفرت فهمًا أفضل لوظائفها البيولوجية والجزيئية. لاحظ أنه تم التنبؤ بـ 83،639 قراءة من حجم الجينوم 3.6 ميجابايت، مع محتوى جوانين- سيتوزين (GC) بنسبة 72.39 ٪. تم تجميع الجينوم في متجاورين، حيث يمثل المتجاور الأكبر الكروموسوم ويمثل المتجاور الأصغر البلازميد. وهو يتألف من 3381 جينًا مشفرًا، مع شرح حوالي 95 ٪ منها وظيفيًا. وهو يتألف من 3318 تسلسل ترميز، وجين tmRNA واحد، و 57 جين tRNA، وخمس مناطق متكررة. كان B. humi واضحًا، حيث تشارك تشابهًا وثيقًا في التسلسل مع الأنواع Demetria terragena وعائلة Dermacoccaceae. أشار التصنيف الوظيفي للأنطولوجيا الجينية (GO) إلى أن أجزاء الخلية والخلية كانت ممثلة بشكل كبير بين فئة المكونات الخلوية ؛ كان النشاط الحفاز والربط أكثر العمليات إثراءً ضمن فئة الوظائف الجزيئية ؛ كانت العمليات الأيضية والخلوية هي الأكثر تمثيلاً في فئة العمليات البيولوجية. كشفت مجموعات من التصنيف الوظيفي للمجموعة التقويمية (COG) أن الجينات المرتبطة بالأيض كانت عالية التخصيب وتم تعيينها في الغالب إلى استقلاب نقل الأحماض الأمينية، والنسخ، وإنتاج الطاقة، والتحويل. علاوة على ذلك، أفاد التصنيف الوظيفي لموسوعة كيوتو للجينات والجينوم (KEGG) أن عملية الأيض كانت أكثر مسارات KEGG تمثيلًا. كانت هناك 52 مجموعة جينية تخليقية حيوية تشارك في التخليق الحيوي للمستقلبات الثانوية، مما يشير إلى أن B. HUMI لديه أنشطة حيوية مضادة للبكتيريا ومضادة للفطريات وسامة للخلايا ومثبطة. تم إيداع مجموعة بيانات تسلسل الجينوم الكامل لـ B. HUMI في مستودع أرشيف النيوكليوتيدات الأوروبي (ENA) تحت رقم الانضمام PRJEB44986 / ERP129097. تم إيداع مجموعة بيانات التعليق التوضيحي للجينوم لـ B. humi في Zenodo. تساهم بيانات التسلسل الجيني المبلغ عنها لـ B. humi في بيانات شاملة للمعلومات الجزيئية الحالية للأنواع، مما يعمل كنهج مهم يسهل تقدم الطب.

Translated Description (French)

Barrientosiimonas humi gen. nov., sp. nov. 39T est une souche rare d'actinobactéries isolée de l'environnement extrême moins exploré du sol antarctique. Ici, nous présentons l'ensemble des données de séquençage et d'annotation du génome provisoire de haute qualité de B. humi de l'Antarctique. L'acide désoxyribonucléique (ADN) génomique extrait a été séquencé à l'aide de la plate-forme de séquençage PacBio Sequel, suivie du système de séquençage Illumina HiSeq. Par la suite, les données d'assemblage de Canu 1.7 et Pilon ont été soumises à une analyse bioinformatique pour l'annotation du génome afin d'analyser l'ensemble des informations génomiques des séquences. Différentes approches d'analyse bioinformatique ont été utilisées pour divulguer une base de génome préliminaire de haute qualité pour B. humi et ont permis de mieux comprendre ses fonctions biologiques et moléculaires. Notez que 83 639 lectures ont été prédites à partir de sa taille de génome de 3,6 Mo, avec une teneur en guanine-cytosine (GC) de 72,39 %. Le génome a été assemblé en deux contigs, où le contig le plus grand représente le chromosome et le contig le plus petit représente le plasmide. Il est composé de 3 381 gènes codants, dont environ 95 % sont fonctionnellement annotés. Il se compose de 3 318 séquences codantes, d'un gène d'ARNtm, de 57 gènes d'ARNt et de cinq régions répétées. B. humi était évident, partageant une similitude de séquence étroite avec l'espèce Demetria terragena et la famille des Dermacoccaceae. La classification fonctionnelle de l'ontologie des gènes (GO) a indiqué que les cellules et les parties cellulaires étaient fortement représentées dans la catégorie des composants cellulaires ; l'activité catalytique et la liaison étaient les processus les plus enrichis dans la catégorie des fonctions moléculaires ; les processus métaboliques et cellulaires étaient les plus représentés dans la catégorie des processus biologiques. Les grappes de classification fonctionnelle des groupes orthologues (COG) ont révélé que les gènes liés au métabolisme étaient hautement enrichis et principalement mappés au métabolisme du transport des acides aminés, à la transcription, à la production d'énergie et à la conversion. De plus, la classification fonctionnelle de l'Encyclopédie des gènes et des génomes de Kyoto (KEGG) a indiqué que le processus métabolique était la voie KEGG la plus représentée. Il y avait 52 groupes de gènes biosynthétiques impliqués dans la biosynthèse des métabolites secondaires, ce qui indique que B. humi a des bioactivités antibactériennes, antifongiques, cytotoxiques et inhibitrices. L'ensemble des données de la séquence du génome entier de B. humi a été déposé dans le référentiel European Nucleotide Archive (ENA) sous le numéro d'accession PRJEB44986 / ERP129097. L'ensemble des données de l'annotation génomique de B. humi avait été déposé dans Zenodo. Les données de séquence génomique rapportées pour B. humi fournissent des données complètes sur les informations moléculaires actuelles de l'espèce, constituant une approche importante qui facilite l'avancement de la médecine.

Translated Description (Spanish)

Barrientosiimonas humi gen. nov., sp. nov. 39T es una rara cepa de actinobacterias aislada del entorno extremo menos explorado del suelo antártico. Aquí, presentamos la secuenciación del genoma completo y los datos de anotación del borrador del genoma de alta calidad de B. humi de la Antártida. El ácido desoxirribonucleico (ADN) genómico extraído se secuenció utilizando la plataforma de secuenciación PacBio Sequel, seguido del sistema de secuenciación Illumina HiSeq. Posteriormente, los datos de ensamblaje de Canu 1.7 y Pilon se sometieron a análisis bioinformático para la anotación del genoma para analizar toda la información genómica de las secuencias. Se utilizaron diferentes enfoques de análisis bioinformático para divulgar un borrador de base del genoma de alta calidad para B. humi y proporcionar una mejor comprensión de sus funciones biológicas y moleculares. Tenga en cuenta que se predijeron 83,639 lecturas a partir de su tamaño de genoma de 3.6Mb, con un contenido de guanina-citosina (GC) del 72.39%. El genoma se ensambló en dos cóntigos, donde el cóntigo más grande representa el cromosoma y el cóntigo más pequeño representa el plásmido. Se compone de 3.381 genes codificantes, de los cuales alrededor del 95% están anotados funcionalmente. Consiste en 3,318 secuencias codificantes, un gen de ARNtm, 57 genes de ARNt y cinco regiones repetidas. B. humi fue evidente, compartiendo una estrecha similitud de secuencia con la especie Demetria terragena y la familia Dermacoccaceae. La clasificación funcional de Gene Ontology (GO) indicó que la célula y las partes celulares estaban altamente representadas entre la categoría de componentes celulares; la actividad catalítica y la unión fueron los procesos más enriquecidos dentro de la categoría de función molecular; los procesos metabólicos y celulares fueron los más representados en la categoría de procesos biológicos. Los grupos de clasificación funcional del Grupo Ortólogo (COG) revelaron que los genes relacionados con el metabolismo estaban altamente enriquecidos y en su mayoría mapeados para el metabolismo del transporte de aminoácidos, la transcripción, la producción de energía y la conversión. Además, la clasificación funcional de la Enciclopedia de Genes y Genomas de Kioto (KEGG) informó que el proceso metabólico era la vía KEGG más representada. Hubo 52 grupos de genes biosintéticos involucrados en la biosíntesis de metabolitos secundarios, lo que indica que B. humi tiene bioactividades antibacterianas, antifúngicas, citotóxicas e inhibidoras. El conjunto de datos de la secuencia del genoma completo de B. humi se ha depositado en el repositorio del Archivo Europeo de Nucleótidos (ENA) con el número de acceso PRJEB44986/ ERP129097. El conjunto de datos de la anotación del genoma de B. humi se había depositado en Zenodo. Los datos de secuencia genómica reportados para B. humi aportan datos integrales a la información molecular actual de la especie, sirviendo como un enfoque significativo que facilita el avance de la medicina.

Additional details

Additional titles

Translated title (Arabic)
تسلسل الجينوم الكامل ومجموعة بيانات التعليقات التوضيحية للبكتيريا الشعاعية النادرة، Barrientosiimonas humi gen. nov.، sp. nov. 39T من القارة القطبية الجنوبية
Translated title (French)
Séquence génomique entière et ensemble de données d'annotation d'actinobactéries rares, Barrientosiimonas humi gen. nov., sp. nov. 39T de l'Antarctique
Translated title (Spanish)
Secuencia del genoma completo y conjunto de datos de anotación de actinobacterias raras, Barrientosiimonas humi gen. nov., sp. nov. 39T de la Antártida

Identifiers

Other
https://openalex.org/W4387569554
DOI
10.1016/j.dib.2023.109657

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Malaysia

References

  • https://openalex.org/W1982855075
  • https://openalex.org/W2045204781
  • https://openalex.org/W2096093282
  • https://openalex.org/W2107772251
  • https://openalex.org/W2119525654
  • https://openalex.org/W2142678478
  • https://openalex.org/W2155628349
  • https://openalex.org/W2171288831
  • https://openalex.org/W2195724570
  • https://openalex.org/W2326996704
  • https://openalex.org/W2803753687
  • https://openalex.org/W2900629010
  • https://openalex.org/W2942829220
  • https://openalex.org/W2949841808
  • https://openalex.org/W2950354111
  • https://openalex.org/W2967688728