Reconstructing unobserved cellular states from paired single-cell lineage tracing and transcriptomics data
Creators
- 1. CentraleSupélec
 - 2. École Normale Supérieure
 - 3. École Normale Supérieure Paris-Saclay
 - 4. University of California System
 - 5. University of California, Berkeley
 - 6. Ragon Institute of MGH, MIT and Harvard
 - 7. Chan Zuckerberg Initiative (United States)
 
Description
A bstract Novel experimental assays now simultaneously measure lineage relationships and transcriptomic states from single cells, thanks to CRISPR/Cas9-based genome engineering. These multimodal measurements allow researchers not only to build comprehensive phylogenetic models relating all cells but also infer transcriptomic determinants of consequential subclonal behavior. The gene expression data, however, is limited to cells that are currently present ("leaves" of the phylogeny). As a consequence, researchers cannot form hypotheses about unobserved, or "ancestral", states that gave rise to the observed population. To address this, we introduce TreeVAE: a probabilistic framework for estimating ancestral transcriptional states. TreeVAE uses a variational autoencoder (VAE) to model the observed transcriptomic data while accounting for the phylogenetic relationships between cells. Using simulations, we demonstrate that TreeVAE outperforms benchmarks in reconstructing ancestral states on several metrics. TreeVAE also provides a measure of uncertainty, which we demonstrate to correlate well with its prediction accuracy. This estimate therefore potentially provides a data-driven way to estimate how far back in the ancestor chain predictions could be made. Finally, using real data from lung cancer metastasis, we show that accounting for phylogenetic relationship between cells improves goodness of fit. Together, TreeVAE provides a principled framework for reconstructing unobserved cellular states from single cell lineage tracing data.
Translated Descriptions
Translated Description (Arabic)
تقيس الاختبارات التجريبية الجديدة الآن في وقت واحد علاقات النسب والحالات النصية من خلايا واحدة، وذلك بفضل هندسة الجينوم القائمة على كريسبر/كاس 9. تسمح هذه القياسات متعددة الوسائط للباحثين ليس فقط ببناء نماذج وراثية شاملة تتعلق بجميع الخلايا ولكن أيضًا استنتاج المحددات النسخية للسلوك تحت النسيلة التبعي. ومع ذلك، تقتصر بيانات التعبير الجيني على الخلايا الموجودة حاليًا (" أوراق "السلالة). ونتيجة لذلك، لا يمكن للباحثين تشكيل فرضيات حول الحالات غير الملحوظة أو "الأسلاف" التي أدت إلى ظهور السكان الملاحظين. لمعالجة هذا، نقدم TreeVAE: إطار احتمالي لتقدير حالات نسخ الأسلاف. تستخدم TreeVAE أداة ترميز تلقائية متغيرة (VAE) لنمذجة البيانات النصية المرصودة مع مراعاة العلاقات الوراثية بين الخلايا. باستخدام المحاكاة، نثبت أن TreeVAE تتفوق على المعايير في إعادة بناء حالات الأسلاف على عدة مقاييس. توفر TreeVAE أيضًا مقياسًا لعدم اليقين، والذي نبرهن على ارتباطه جيدًا بدقة التنبؤ. لذلك من المحتمل أن يوفر هذا التقدير طريقة تعتمد على البيانات لتقدير إلى أي مدى يمكن إجراء تنبؤات سلسلة الأسلاف. أخيرًا، باستخدام بيانات حقيقية من ورم خبيث لسرطان الرئة، نظهر أن حساب العلاقة التطورية بين الخلايا يحسن من جودة الملاءمة. توفر TreeVAE معًا إطارًا مبدئيًا لإعادة بناء الحالات الخلوية غير الملحوظة من بيانات تتبع سلالة الخلية الواحدة.Translated Description (French)
De nouveaux tests expérimentaux bstract mesurent désormais simultanément les relations de lignée et les états transcriptomiques à partir de cellules uniques, grâce à l'ingénierie du génome basée sur CRISPR/Cas9. Ces mesures multimodales permettent aux chercheurs non seulement de construire des modèles phylogénétiques complets reliant toutes les cellules, mais également d'inférer les déterminants transcriptomiques du comportement subclonal consécutif. Les données d'expression génique, cependant, sont limitées aux cellules actuellement présentes (« feuilles » de la phylogénie). En conséquence, les chercheurs ne peuvent pas formuler d'hypothèses sur les états non observés, ou « ancestraux », qui ont donné lieu à la population observée. Pour y remédier, nous introduisons TreeVAE : un cadre probabiliste pour estimer les états transcriptionnels ancestraux. TreeVAE utilise un auto-encodeur variationnel (VAE) pour modéliser les données transcriptomiques observées tout en tenant compte des relations phylogénétiques entre les cellules. À l'aide de simulations, nous démontrons que TreeVAE surpasse les repères dans la reconstruction des états ancestraux sur plusieurs métriques. TreeVAE fournit également une mesure de l'incertitude, que nous démontrons bien corrélée avec sa précision de prédiction. Cette estimation fournit donc potentiellement un moyen basé sur les données pour estimer à quelle distance de la chaîne des ancêtres les prédictions pourraient être faites. Enfin, en utilisant des données réelles sur les métastases du cancer du poumon, nous montrons que la prise en compte de la relation phylogénétique entre les cellules améliore la qualité de l'ajustement. Ensemble, TreeVAE fournit un cadre de principe pour reconstruire des états cellulaires non observés à partir de données de traçage de lignée cellulaire unique.Translated Description (Spanish)
Un bstract Ensayos experimentales novedosos ahora miden simultáneamente las relaciones de linaje y los estados transcriptómicos de células individuales, gracias a la ingeniería del genoma basada en CRISPR/Cas9. Estas mediciones multimodales permiten a los investigadores no solo construir modelos filogenéticos integrales que relacionan todas las células, sino también inferir determinantes transcriptómicos del comportamiento subclonal consecuente. Los datos de expresión génica, sin embargo, se limitan a las células que están presentes actualmente ("hojas" de la filogenia). Como consecuencia, los investigadores no pueden formular hipótesis sobre estados no observados, o "ancestrales", que dieron lugar a la población observada. Para abordar esto, presentamos TreeVAE: un marco probabilístico para estimar los estados transcripcionales ancestrales. TreeVAE utiliza un autocodificador variacional (VAE) para modelar los datos transcriptómicos observados mientras se tienen en cuenta las relaciones filogenéticas entre las células. Usando simulaciones, demostramos que TreeVAE supera los puntos de referencia en la reconstrucción de estados ancestrales en varias métricas. TreeVAE también proporciona una medida de incertidumbre, que demostramos que se correlaciona bien con su precisión de predicción. Por lo tanto, esta estimación proporciona potencialmente una forma basada en datos de estimar hasta qué punto se podrían hacer predicciones en la cadena ancestral. Finalmente, utilizando datos reales de metástasis de cáncer de pulmón, mostramos que tener en cuenta la relación filogenética entre las células mejora la bondad del ajuste. Juntos, TreeVAE proporciona un marco de principios para reconstruir estados celulares no observados a partir de datos de rastreo de linaje unicelular.Files
      
        2021.05.28.446021.full.pdf.pdf
        
      
    
    
      
        Files
         (838.5 kB)
        
      
    
    | Name | Size | Download all | 
|---|---|---|
| 
          
          md5:eceb47cf68b8da683fc766c94d045a57
           | 
        
        838.5 kB | Preview Download | 
Additional details
Additional titles
- Translated title (Arabic)
 - إعادة بناء الحالات الخلوية غير الملحوظة من بيانات تتبع النسب والنسخ الوراثي للخلية الواحدة المقترنة
 - Translated title (French)
 - Reconstruction d'états cellulaires non observés à partir de données appariées de traçage de lignée unicellulaire et de transcriptomique
 - Translated title (Spanish)
 - Reconstrucción de estados celulares no observados a partir de datos emparejados de trazado de linaje unicelular y transcriptómica
 
Identifiers
- Other
 - https://openalex.org/W3173127629
 - DOI
 - 10.1101/2021.05.28.446021
 
            
              References
            
          
        - https://openalex.org/W2406991867
 - https://openalex.org/W2795331645
 - https://openalex.org/W2896103138
 - https://openalex.org/W2901677030
 - https://openalex.org/W2949490462
 - https://openalex.org/W2965552103
 - https://openalex.org/W2972184354
 - https://openalex.org/W3004512186
 - https://openalex.org/W3014807564
 - https://openalex.org/W3015748341
 - https://openalex.org/W3088354555
 - https://openalex.org/W3123518732
 - https://openalex.org/W3158541360
 - https://openalex.org/W3161639224