Published September 1, 2021 | Version v1
Publication Open

DeePhage: distinguishing virulent and temperate phage-derived sequences in metavirome data with a deep learning approach

  • 1. Peking University
  • 2. National Institute of Biological Sciences, Beijing
  • 3. Tsinghua University
  • 4. Georgia Institute of Technology
  • 5. Emory University

Description

Prokaryotic viruses referred to as phages can be divided into virulent and temperate phages. Distinguishing virulent and temperate phage-derived sequences in metavirome data is important for elucidating their different roles in interactions with bacterial hosts and regulation of microbial communities. However, there is no experimental or computational approach to effectively classify their sequences in culture-independent metavirome. We present a new computational method, DeePhage, which can directly and rapidly judge each read or contig as a virulent or temperate phage-derived fragment.DeePhage uses a "one-hot" encoding form to represent DNA sequences in detail. Sequence signatures are detected via a convolutional neural network to obtain valuable local features. The accuracy of DeePhage on 5-fold cross-validation reaches as high as 89%, nearly 10% and 30% higher than that of 2 similar tools, PhagePred and PHACTS. On real metavirome, DeePhage correctly predicts the highest proportion of contigs when using BLAST as annotation, without apparent preferences. Besides, DeePhage reduces running time vs PhagePred and PHACTS by 245 and 810 times, respectively, under the same computational configuration. By direct detection of the temperate viral fragments from metagenome and metavirome, we furthermore propose a new strategy to explore phage transformations in the microbial community. The ability to detect such transformations provides us a new insight into the potential treatment for human disease.DeePhage is a novel tool developed to rapidly and efficiently identify 2 kinds of phage fragments especially for metagenomics analysis. DeePhage is freely available via http://cqb.pku.edu.cn/ZhuLab/DeePhage or https://github.com/shufangwu/DeePhage.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يمكن تقسيم الفيروسات بدائية النواة المشار إليها باسم العاثيات إلى عاثيات خبيثة ومعتدلة. يعد التمييز بين التسلسلات الخبيثة والمعتدلة المشتقة من العاثيات في بيانات الميتافيروم أمرًا مهمًا لتوضيح أدوارها المختلفة في التفاعلات مع المضيفين البكتيريين وتنظيم المجتمعات الميكروبية. ومع ذلك، لا يوجد نهج تجريبي أو حسابي لتصنيف تسلسلها بشكل فعال في الميتافيروم المستقل عن الثقافة. نقدم طريقة حسابية جديدة، DeePhage، والتي يمكنها الحكم بشكل مباشر وسريع على كل قراءة أو تواصل على أنه جزء خبيث أو معتدل مشتق من العاثية. يستخدم DePhage نموذج ترميز "أحادي" لتمثيل تسلسل الحمض النووي بالتفصيل. يتم الكشف عن توقيعات التسلسل عبر شبكة عصبية التفافية للحصول على ميزات محلية قيمة. تصل دقة DeePhage في التحقق المتبادل من 5 أضعاف إلى 89 ٪، أي ما يقرب من 10 ٪ و 30 ٪ أعلى من أداتين مشابهتين، PhagePred و PHACTS. في الميتافيروم الحقيقي، يتنبأ DeePhage بشكل صحيح بأعلى نسبة من التجاورات عند استخدام BLAST كتعليق توضيحي، دون تفضيلات واضحة. إلى جانب ذلك، يقلل DeePhage من وقت التشغيل مقابل PhagePred و PHACTS بمقدار 245 و 810 مرات، على التوالي، تحت نفس التكوين الحسابي. من خلال الكشف المباشر عن الشظايا الفيروسية المعتدلة من الميتاجينوم والميتافيروم، نقترح علاوة على ذلك استراتيجية جديدة لاستكشاف تحولات العاثية في المجتمع الميكروبي. توفر لنا القدرة على اكتشاف مثل هذه التحولات رؤية جديدة حول العلاج المحتمل للأمراض التي تصيب الإنسان. Deephage هي أداة جديدة تم تطويرها لتحديد نوعين من شظايا العاثيات بسرعة وكفاءة خاصة لتحليل الميتاجينوميات. DeePhage متاح مجانًا عبر http://cqb.pku.edu.cn/ZhuLab/DeePhage أو https://github.com/shufangwu/DeePhage.

Translated Description (French)

Les virus procaryotes appelés phages peuvent être divisés en phages virulents et en phages tempérés. Il est important de distinguer les séquences virulentes et tempérées dérivées de phages dans les données sur les métaviromes pour élucider leurs différents rôles dans les interactions avec les hôtes bactériens et la régulation des communautés microbiennes. Cependant, il n'existe aucune approche expérimentale ou computationnelle pour classer efficacement leurs séquences en métavirome indépendant de la culture. Nous présentons une nouvelle méthode de calcul, DeePhage, qui peut juger directement et rapidement chaque lecture ou contig comme un fragment dérivé d'un phage virulent ou tempéré. DeePhage utilise une forme de codage « one-hot » pour représenter les séquences d'ADN en détail. Les signatures de séquence sont détectées via un réseau neuronal convolutionnel pour obtenir des caractéristiques locales précieuses. La précision de DeePhage sur la validation croisée quintuple atteint 89 %, soit près de 10 % et 30 % de plus que celle de 2 outils similaires, PhagePred et PHACTS. Sur le métavirome réel, DeePhage prédit correctement la plus forte proportion de contigs lors de l'utilisation de BLAST comme annotation, sans préférences apparentes. En outre, DeePhage réduit le temps d'exécution par rapport à PhagePred et PHACTS de 245 et 810 fois, respectivement, dans la même configuration de calcul. Par détection directe des fragments viraux tempérés du métagénome et du métavirome, nous proposons en outre une nouvelle stratégie pour explorer les transformations phagiques dans la communauté microbienne. La capacité de détecter de telles transformations nous donne un nouvel aperçu du traitement potentiel de la maladie humaine. DeePhage est un nouvel outil développé pour identifier rapidement et efficacement 2 types de fragments de phages, en particulier pour l'analyse métagénomique. DeePhage est disponible gratuitement via http://cqb.pku.edu.cn/ZhuLab/DeePhage ou https://github.com/shufangwu/DeePhage.

Translated Description (Spanish)

Los virus procariotas denominados fagos se pueden dividir en fagos virulentos y templados. Distinguir las secuencias derivadas de fagos virulentos y templados en los datos del metaviromo es importante para dilucidar sus diferentes roles en las interacciones con los huéspedes bacterianos y la regulación de las comunidades microbianas. Sin embargo, no existe un enfoque experimental o computacional para clasificar eficazmente sus secuencias en metaviromos independientes del cultivo. Presentamos un nuevo método computacional, DeePhage, que puede juzgar directa y rápidamente cada lectura o cóntigo como un fragmento virulento o templado derivado de fagos. DeePhage utiliza una forma de codificación "one-hot" para representar secuencias de ADN en detalle. Las firmas de secuencia se detectan a través de una red neuronal convolucional para obtener características locales valiosas. La precisión de DeePhage en la validación cruzada de 5 veces alcanza hasta un 89%, casi un 10% y un 30% más que la de 2 herramientas similares, PhagePred y PHACTS. En el metaviromo real, DeePhage predice correctamente la mayor proporción de cóntigos cuando se usa BLAST como anotación, sin preferencias aparentes. Además, DeePhage reduce el tiempo de ejecución frente a PhagePred y PHACTS en 245 y 810 veces, respectivamente, bajo la misma configuración computacional. Mediante la detección directa de los fragmentos virales templados del metagenoma y el metaviromo, proponemos además una nueva estrategia para explorar las transformaciones de fagos en la comunidad microbiana. La capacidad de detectar tales transformaciones nos proporciona una nueva visión del tratamiento potencial para la enfermedad humana. DeePhage es una nueva herramienta desarrollada para identificar de forma rápida y eficiente 2 tipos de fragmentos de fagos, especialmente para el análisis metagenómico. DeePhage está disponible gratuitamente a través de http://cqb.pku.edu.cn/ZhuLab/DeePhage o https://github.com/shufangwu/DeePhage.

Files

giab056.pdf.pdf

Files (93 Bytes)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:b0d506893d4802090edf1644f5f082cd
93 Bytes
Preview Download

Additional details

Additional titles

Translated title (Arabic)
DeePhage: التمييز بين التسلسلات المشتقة من العاثية الخبيثة والمعتدلة في بيانات الميتافيروم مع نهج التعلم العميق
Translated title (French)
DeePhage : distinction des séquences virulentes et tempérées dérivées de phages dans les données métavirome avec une approche d'apprentissage en profondeur
Translated title (Spanish)
DeePhage: distinguir secuencias virulentas y templadas derivadas de fagos en datos de metaviromos con un enfoque de aprendizaje profundo

Identifiers

Other
https://openalex.org/W3197879762
DOI
10.1093/gigascience/giab056

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W1989348205
  • https://openalex.org/W2001561488
  • https://openalex.org/W2013544175
  • https://openalex.org/W2036741396
  • https://openalex.org/W2048818637
  • https://openalex.org/W2069689025
  • https://openalex.org/W2081319466
  • https://openalex.org/W2087780336
  • https://openalex.org/W2089468765
  • https://openalex.org/W2095705004
  • https://openalex.org/W2098132478
  • https://openalex.org/W2101642564
  • https://openalex.org/W2106890176
  • https://openalex.org/W2107903949
  • https://openalex.org/W2119859604
  • https://openalex.org/W2120902911
  • https://openalex.org/W2123373275
  • https://openalex.org/W2124869517
  • https://openalex.org/W2125826054
  • https://openalex.org/W2137044495
  • https://openalex.org/W2140647036
  • https://openalex.org/W2145370398
  • https://openalex.org/W2146341019
  • https://openalex.org/W2159340193
  • https://openalex.org/W2187089797
  • https://openalex.org/W2345960958
  • https://openalex.org/W2514983714
  • https://openalex.org/W2559100382
  • https://openalex.org/W2579294549
  • https://openalex.org/W2610214149
  • https://openalex.org/W2616941696
  • https://openalex.org/W2732139758
  • https://openalex.org/W2734399491
  • https://openalex.org/W2735062779
  • https://openalex.org/W2792643794
  • https://openalex.org/W2886112809
  • https://openalex.org/W2901652748
  • https://openalex.org/W2919326595
  • https://openalex.org/W2922974961
  • https://openalex.org/W2935685975
  • https://openalex.org/W2949831026
  • https://openalex.org/W2951325968
  • https://openalex.org/W2964121744
  • https://openalex.org/W2989568248
  • https://openalex.org/W2989706094
  • https://openalex.org/W3003110834
  • https://openalex.org/W3015124682
  • https://openalex.org/W3028566758
  • https://openalex.org/W3098935121
  • https://openalex.org/W3128142453
  • https://openalex.org/W3197879762
  • https://openalex.org/W4230932396