MITE Tracker: an accurate approach to identify miniature inverted-repeat transposable elements in large genomes
- 1. National Institute of Industrial Technology
- 2. National Agricultural Technology Institute
- 3. Consejo Nacional de Investigaciones Científicas y Técnicas
Description
Miniature inverted-repeat transposable elements (MITEs) are short, non-autonomous class II transposable elements present in a high number of conserved copies in eukaryote genomes. An accurate identification of these elements can help to shed light on the mechanisms controlling genome evolution and gene regulation. The structure and distribution of these elements are well-defined and therefore computational approaches can be used to identify MITEs sequences. Here we describe MITE Tracker, a novel, open source software program that finds and classifies MITEs using an efficient alignment strategy to retrieve nearby inverted-repeat sequences from large genomes. This program groups them into high sequence homology families using a fast clustering algorithm and finally filters only those elements that were likely transposed from different genomic locations because of their low scoring flanking sequence alignment. Many programs have been proposed to find MITEs hidden in genomes. However, none of them are able to process large-scale genomes such as that of bread wheat. Furthermore, in many cases the existing methods perform high false-positive rates (or miss rates). The rice genome was used as reference to compare MITE Tracker against known tools. Our method turned out to be the most reliable in our tests. Indeed, it revealed more known elements, presented the lowest false-positive number and was the only program able to run with the bread wheat genome as input. In wheat, MITE Tracker discovered 6013 MITE families and allowed the first structural exploration of MITEs in the complete bread wheat genome.
Translated Descriptions
Translated Description (Arabic)
العناصر القابلة للنقل المقلوبة والمكررة المصغرة (MITEs) هي عناصر قابلة للنقل قصيرة وغير مستقلة من الفئة الثانية موجودة في عدد كبير من النسخ المحفوظة في جينومات حقيقيات النوى. يمكن أن يساعد التحديد الدقيق لهذه العناصر في تسليط الضوء على الآليات التي تتحكم في تطور الجينوم وتنظيم الجينات. هيكل وتوزيع هذه العناصر محدد جيدًا، وبالتالي يمكن استخدام الأساليب الحسابية لتحديد تسلسلات MITEs. هنا نصف MITE Tracker، وهو برنامج جديد مفتوح المصدر يعثر على MITEs ويصنفها باستخدام استراتيجية محاذاة فعالة لاسترداد تسلسلات التكرار المقلوب القريبة من الجينومات الكبيرة. يقوم هذا البرنامج بتجميعهم في عائلات تماثل عالية التسلسل باستخدام خوارزمية تجميع سريعة وأخيراً يقوم فقط بتصفية تلك العناصر التي من المحتمل أن يتم نقلها من مواقع جينية مختلفة بسبب محاذاة التسلسل المرافقة ذات الدرجات المنخفضة. تم اقتراح العديد من البرامج للعثور على MITEs مخبأة في الجينوم. ومع ذلك، لا يستطيع أي منهم معالجة الجينومات واسعة النطاق مثل قمح الخبز. علاوة على ذلك، في كثير من الحالات، تؤدي الأساليب الحالية إلى معدلات إيجابية كاذبة عالية (أو معدلات خطأ). تم استخدام جينوم الأرز كمرجع لمقارنة متتبع العث بالأدوات المعروفة. اتضح أن طريقتنا هي الأكثر موثوقية في اختباراتنا. في الواقع، كشف عن عناصر أكثر شهرة، وقدم أقل عدد إيجابي خاطئ وكان البرنامج الوحيد القادر على العمل مع جينوم قمح الخبز كمدخل. في القمح، اكتشف MITE Tracker 6013 عائلة من العث وسمح بالاستكشاف الهيكلي الأول لـ MITEs في جينوم قمح الخبز الكامل.Translated Description (French)
Les éléments transposables miniatures à répétition inversée (MITE) sont des éléments transposables courts et non autonomes de classe II présents dans un nombre élevé de copies conservées dans les génomes eucaryotes. Une identification précise de ces éléments peut aider à faire la lumière sur les mécanismes contrôlant l'évolution du génome et la régulation des gènes. La structure et la distribution de ces éléments sont bien définies et, par conséquent, des approches informatiques peuvent être utilisées pour identifier les séquences MITE. Ici, nous décrivons MITE Tracker, un nouveau logiciel open source qui trouve et classe les MITE en utilisant une stratégie d'alignement efficace pour récupérer les séquences répétées inversées à proximité à partir de grands génomes. Ce programme les regroupe en familles d'homologie de séquence élevée à l'aide d'un algorithme de regroupement rapide et ne filtre finalement que les éléments qui ont probablement été transposés à partir de différents emplacements génomiques en raison de leur faible alignement de séquence flanquante. De nombreux programmes ont été proposés pour trouver des MITE cachés dans les génomes. Cependant, aucun d'entre eux n'est capable de traiter des génomes à grande échelle tels que celui du blé panifiable. En outre, dans de nombreux cas, les méthodes existantes produisent des taux élevés de faux positifs (ou des taux d'oubli). Le génome du riz a été utilisé comme référence pour comparer le traqueur D'ACARIENS aux outils connus. Notre méthode s'est avérée être la plus fiable dans nos tests. En effet, il a révélé des éléments plus connus, a présenté le plus faible nombre de faux positifs et a été le seul programme capable de fonctionner avec le génome du blé tendre en entrée. Dans le blé, MITE Tracker a découvert 6013 familles D'ACARIENS et a permis la première exploration structurelle des MITE dans le génome complet du blé tendre.Translated Description (Spanish)
Los elementos transponibles de repetición invertida en miniatura (MITE) son elementos transponibles de clase II cortos y no autónomos presentes en un gran número de copias conservadas en genomas eucariotas. Una identificación precisa de estos elementos puede ayudar a arrojar luz sobre los mecanismos que controlan la evolución del genoma y la regulación génica. La estructura y distribución de estos elementos están bien definidas y, por lo tanto, se pueden utilizar enfoques computacionales para identificar secuencias MITE. Aquí describimos MITE Tracker, un novedoso programa de software de código abierto que encuentra y clasifica MITE utilizando una estrategia de alineación eficiente para recuperar secuencias de repetición invertida cercanas de genomas grandes. Este programa los agrupa en familias de homología de secuencia alta utilizando un algoritmo de agrupamiento rápido y finalmente filtra solo aquellos elementos que probablemente se transpusieron desde diferentes ubicaciones genómicas debido a su alineación de secuencia flanqueante de baja puntuación. Se han propuesto muchos programas para encontrar MITE ocultos en los genomas. Sin embargo, ninguno de ellos es capaz de procesar genomas a gran escala como el del trigo para pan. Además, en muchos casos los métodos existentes realizan altas tasas de falsos positivos (o tasas de error). El genoma del arroz se utilizó como referencia para comparar el rastreador de ÁCAROS con herramientas conocidas. Nuestro método resultó ser el más fiable en nuestras pruebas. De hecho, reveló más elementos conocidos, presentó el número más bajo de falsos positivos y fue el único programa capaz de funcionar con el genoma del trigo para pan como entrada. En trigo, MITE Tracker descubrió 6013 familias de ÁCAROS y permitió la primera exploración estructural de MITEs en el genoma completo del trigo para pan.Files
s12859-018-2376-y.pdf
Files
(1.5 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:298f179b9a6aee24aba47837a19279fd
|
1.5 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- MITE Tracker: نهج دقيق لتحديد العناصر القابلة للنقل المصغرة المقلوبة المكررة في الجينومات الكبيرة
- Translated title (French)
- MITE Tracker : une approche précise pour identifier les éléments transposables miniatures à répétition inversée dans les grands génomes
- Translated title (Spanish)
- MITE Tracker: un enfoque preciso para identificar elementos transponibles de repetición invertida en miniatura en genomas grandes
Identifiers
- Other
- https://openalex.org/W2895144975
- DOI
- 10.1186/s12859-018-2376-y
References
- https://openalex.org/W1482190741
- https://openalex.org/W1902004182
- https://openalex.org/W1975445958
- https://openalex.org/W1978922472
- https://openalex.org/W1990813498
- https://openalex.org/W1994347466
- https://openalex.org/W1995524273
- https://openalex.org/W2001671544
- https://openalex.org/W2004564851
- https://openalex.org/W2012331775
- https://openalex.org/W2019851585
- https://openalex.org/W2027486853
- https://openalex.org/W2056671569
- https://openalex.org/W2059864757
- https://openalex.org/W2066320476
- https://openalex.org/W2069712815
- https://openalex.org/W2071501400
- https://openalex.org/W2087726730
- https://openalex.org/W2096525273
- https://openalex.org/W2100234791
- https://openalex.org/W2102534496
- https://openalex.org/W2114850508
- https://openalex.org/W2115427074
- https://openalex.org/W2134783286
- https://openalex.org/W2139028033
- https://openalex.org/W2141272722
- https://openalex.org/W2149335334
- https://openalex.org/W2158442445
- https://openalex.org/W2170747616
- https://openalex.org/W2175948239
- https://openalex.org/W2284038151
- https://openalex.org/W2467672047
- https://openalex.org/W2513506562
- https://openalex.org/W2591586947
- https://openalex.org/W2619934725
- https://openalex.org/W2728987286
- https://openalex.org/W2790772971
- https://openalex.org/W2794163654
- https://openalex.org/W2886785109
- https://openalex.org/W4238718120