STRategy: A support system for collecting and analyzing next-generation sequencing data of short tandem repeats for forensic science
Creators
- 1. Chulalongkorn University
- 2. King Chulalongkorn Memorial Hospital
- 3. Thai Red Cross Society
Description
Short tandem repeats (STRs) are short repeated sequences commonly found in the human genome and valuable in forensic science, used for human identity and relatedness markers. Next-generation sequencing (NGS) technologies, e.g., ForenSeq Signature Prep, can sequence STRs, inferring length-based alleles and single nucleotide polymorphisms (SNPs) and providing valuable insights into population and sub-population structures. Despite the potential benefits of NGS for STRs, no open-source software platform integrates the collection, management, and analysis of STR data from NGS into one place. Users must use multiple programs to process their STR data and then collect the results into a separate database or a file system folder. Moreover, analyzing repeat structures (STR repeat motifs) may require learning multiple software tools, making the process inefficient and cumbersome. To address this gap, we introduce the STRategy, a standalone web-based application supporting essential STR data management and analysis capabilities. The STRategy allows users to collect their data into its database, automatically calculates forensic parameters, and visualizes the analyzed data in various forms. Users can search the database using different options, such as by profile, loci, and genotypes, with and without a specific test kit. Moreover, users can also find the nucleotide variants of a locus among the samples. We designed the STRategy for internal use in a laboratory or an organization. Hence, our system includes role-based access control that allows users to search for or access specific data based on their responsibilities. The administrator role can customize the system, for example, configure maps according to the samples' geographic data, and manage reference STR repeat motifs. A laboratory or an organization can download and install a copy of STRategy on their local system using Docker, as described in https://github.com/cucpbioinfo/STRategy. In summary, the STRategy is an end-to-end system that provides users with a database to collect the analyzed STR data from NGS, the dynamic analyses of forensic parameters, and the variants of STR patterns according to the newly added samples, which are then explorable via various search options and visualizations. The system is helpful for both forensic investigations and forensic genetics.
Translated Descriptions
Translated Description (Arabic)
التكرارات الترادفية القصيرة (STRs) هي تسلسلات متكررة قصيرة شائعة في الجينوم البشري وقيمة في علم الطب الشرعي، وتستخدم للهوية البشرية وعلامات الارتباط. يمكن لتقنيات التسلسل من الجيل التالي (NGS)، على سبيل المثال، ForenSeq Signature Prep، تسلسل تقارير المعاملات المشبوهة، واستنتاج الأليلات القائمة على الطول والأشكال المتعددة للنيوكليوتيدات المفردة (SNPs) وتوفير رؤى قيمة حول السكان وهياكل السكان الفرعية. على الرغم من الفوائد المحتملة لتقارير المعاملات المشبوهة، لا توجد منصة برمجية مفتوحة المصدر تدمج جمع وإدارة وتحليل بيانات تقارير المعاملات المشبوهة من تقارير المعاملات المشبوهة من تقارير المعاملات المشبوهة في مكان واحد. يجب على المستخدمين استخدام برامج متعددة لمعالجة بيانات STR الخاصة بهم ثم جمع النتائج في قاعدة بيانات منفصلة أو مجلد نظام ملفات. علاوة على ذلك، قد يتطلب تحليل هياكل التكرار (زخارف تكرار STR) تعلم أدوات برمجية متعددة، مما يجعل العملية غير فعالة ومرهقة. لمعالجة هذه الفجوة، نقدم استراتيجية المعاملات المشبوهة، وهو تطبيق مستقل قائم على الويب يدعم قدرات إدارة وتحليل بيانات المعاملات المشبوهة الأساسية. تتيح استراتيجية المعاملات المشبوهة للمستخدمين جمع بياناتهم في قاعدة بياناتها، وحساب معلمات الطب الشرعي تلقائيًا، وتصور البيانات التي تم تحليلها في أشكال مختلفة. يمكن للمستخدمين البحث في قاعدة البيانات باستخدام خيارات مختلفة، مثل الملف الشخصي والمواقع والأنماط الجينية، مع وبدون مجموعة اختبار محددة. علاوة على ذلك، يمكن للمستخدمين أيضًا العثور على متغيرات النيوكليوتيدات للموضع بين العينات. لقد صممنا استراتيجية المعاملات المشبوهة للاستخدام الداخلي في مختبر أو منظمة. وبالتالي، يتضمن نظامنا التحكم في الوصول القائم على الأدوار والذي يسمح للمستخدمين بالبحث عن بيانات محددة أو الوصول إليها بناءً على مسؤولياتهم. يمكن لدور المسؤول تخصيص النظام، على سبيل المثال، وتكوين الخرائط وفقًا للبيانات الجغرافية للعينات، وإدارة زخارف تكرار STR المرجعية. يمكن للمختبر أو المنظمة تنزيل وتثبيت نسخة من STRategy على نظامها المحلي باستخدام Docker، كما هو موضح في https://github.com/cucpbioinfo/STRategy. باختصار، استراتيجية STR هي نظام شامل يوفر للمستخدمين قاعدة بيانات لجمع بيانات STR التي تم تحليلها من NGS، والتحليلات الديناميكية لمعلمات الطب الشرعي، ومتغيرات أنماط STR وفقًا للعينات المضافة حديثًا، والتي يمكن استكشافها بعد ذلك عبر خيارات البحث والتصورات المختلفة. هذا النظام مفيد لكل من تحقيقات الطب الشرعي وعلم الوراثة الشرعي.Translated Description (French)
Les courtes répétitions en tandem (STR) sont de courtes séquences répétées couramment trouvées dans le génome humain et précieuses en médecine légale, utilisées pour les marqueurs d'identité humaine et de parenté. Les technologies de séquençage de nouvelle génération (NGS), par exemple, ForenSeq Signature Prep, peuvent séquencer les STR, en déduisant des allèles basés sur la longueur et des polymorphismes mononucléotidiques (SNP) et en fournissant des informations précieuses sur les structures de population et de sous-population. Malgré les avantages potentiels de NGS pour les dos, aucune plate-forme logicielle open source n'intègre la collecte, la gestion et l'analyse des données de dos de NGS en un seul endroit. Les utilisateurs doivent utiliser plusieurs programmes pour traiter leurs données STR, puis collecter les résultats dans une base de données distincte ou un dossier de système de fichiers. De plus, l'analyse des structures de répétition (motifs de répétition STR) peut nécessiter l'apprentissage de plusieurs outils logiciels, ce qui rend le processus inefficace et fastidieux. Pour combler cette lacune, nous introduisons la STRategy, une application Web autonome prenant en charge les capacités essentielles de gestion et d'analyse des données STR. La STRategy permet aux utilisateurs de collecter leurs données dans sa base de données, de calculer automatiquement les paramètres médico-légaux et de visualiser les données analysées sous diverses formes. Les utilisateurs peuvent effectuer des recherches dans la base de données à l'aide de différentes options, telles que le profil, les loci et les génotypes, avec et sans kit de test spécifique. De plus, les utilisateurs peuvent également trouver les variants nucléotidiques d'un locus parmi les échantillons. Nous avons conçu la stratégie pour un usage interne dans un laboratoire ou une organisation. Par conséquent, notre système comprend un contrôle d'accès basé sur les rôles qui permet aux utilisateurs de rechercher ou d'accéder à des données spécifiques en fonction de leurs responsabilités. Le rôle d'administrateur peut personnaliser le système, par exemple, configurer des cartes en fonction des données géographiques des échantillons et gérer les motifs de répétition STR de référence. Un laboratoire ou une organisation peut télécharger et installer une copie de STRategy sur son système local à l'aide de Docker, comme décrit sur https://github.com/cucpbioinfo/STRategy. En résumé, la STRategy est un système de bout en bout qui fournit aux utilisateurs une base de données pour collecter les données STR analysées de NGS, les analyses dynamiques des paramètres médico-légaux et les variantes des modèles STR en fonction des échantillons nouvellement ajoutés, qui sont ensuite explorables via diverses options de recherche et visualisations. Le système est utile à la fois pour les enquêtes médico-légales et la génétique médico-légale.Translated Description (Spanish)
Las repeticiones cortas en tándem (Str) son secuencias cortas repetidas que se encuentran comúnmente en el genoma humano y son valiosas en la ciencia forense, utilizadas para marcadores de identidad y relación humana. Las tecnologías de secuenciación de próxima generación (NGS), por ejemplo, ForenSeq Signature Prep, pueden secuenciar Str, inferir alelos basados en la longitud y polimorfismos de un solo nucleótido (SNP) y proporcionar información valiosa sobre las estructuras de poblaciones y subpoblaciones. A pesar de los beneficios potenciales de NGS para los ROS, ninguna plataforma de software de código abierto integra la recopilación, gestión y análisis de datos de ROS de NGS en un solo lugar. Los usuarios deben usar varios programas para procesar sus datos STR y luego recopilar los resultados en una base de datos separada o en una carpeta del sistema de archivos. Además, el análisis de estructuras de repetición (motivos de repetición STR) puede requerir el aprendizaje de múltiples herramientas de software, lo que hace que el proceso sea ineficiente y engorroso. Para abordar esta brecha, presentamos STRategy, una aplicación web independiente que admite capacidades esenciales de gestión y análisis de datos de STR. La STRategy permite a los usuarios recopilar sus datos en su base de datos, calcula automáticamente los parámetros forenses y visualiza los datos analizados de diversas formas. Los usuarios pueden buscar en la base de datos utilizando diferentes opciones, como por perfil, loci y genotipos, con y sin un kit de prueba específico. Además, los usuarios también pueden encontrar las variantes de nucleótidos de un locus entre las muestras. Diseñamos la STRategy para uso interno en un laboratorio o una organización. Por lo tanto, nuestro sistema incluye un control de acceso basado en roles que permite a los usuarios buscar o acceder a datos específicos en función de sus responsabilidades. El rol de administrador puede personalizar el sistema, por ejemplo, configurar mapas de acuerdo con los datos geográficos de las muestras y administrar motivos de repetición STR de referencia. Un laboratorio o una organización puede descargar e instalar una copia de STRategy en su sistema local utilizando Docker, como se describe en https://github.com/cucpbioinfo/STRategy. En resumen, la STRategy es un sistema de extremo a extremo que proporciona a los usuarios una base de datos para recopilar los datos de STR analizados de NGS, los análisis dinámicos de los parámetros forenses y las variantes de los patrones de Str de acuerdo con las muestras recién agregadas, que luego se pueden explorar a través de varias opciones de búsqueda y visualizaciones. El sistema es útil tanto para las investigaciones forenses como para la genética forense.Files
journal.pone.0282551&type=printable.pdf
Files
(1.9 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:109142e6bdbbc34e6b15d4d735f24658
|
1.9 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- STRategy: نظام دعم لجمع وتحليل بيانات تسلسل الجيل التالي من التكرارات الترادفية القصيرة لعلوم الطب الشرعي
- Translated title (French)
- STRategy : Un système de soutien pour la collecte et l'analyse de données de séquençage de prochaine génération de courtes répétitions en tandem pour la science médico-légale
- Translated title (Spanish)
- STRategy: Un sistema de apoyo para recopilar y analizar datos de secuenciación de próxima generación de repeticiones cortas en tándem para la ciencia forense
Identifiers
- Other
- https://openalex.org/W4384521650
- DOI
- 10.1371/journal.pone.0282551
References
- https://openalex.org/W146354108
- https://openalex.org/W1541290060
- https://openalex.org/W1803375514
- https://openalex.org/W2144430639
- https://openalex.org/W2159075303
- https://openalex.org/W2429349951
- https://openalex.org/W2620598370
- https://openalex.org/W2735250610
- https://openalex.org/W2793968990
- https://openalex.org/W3029933338
- https://openalex.org/W3131734180
- https://openalex.org/W3216302449