St. Jude Children’s Research Hospital, Microsoft e DNAnexus lanciano una piattaforma di genomica dedicata all’oncologia pediatrica.
Dopo che, nel 2010, gli scienziati del St. Jude Children’s Research Hospital hanno iniziato a rendere disponibili al pubblico i dati anonimi dei pazienti oncologici pediatrici, si è presto capito che il volume dei dati è troppo grande per un facile accesso.
Così hanno esplorato le soluzioni tecniche possibili e hanno iniziato a lavorare con Microsoft e DNAnexus. Ora è finalmente attiva la piattaforma basata su cloud nata da questa partnership.
Secondo St. Jude si tratta del più grande archivio pubblico al mondo di dati sulla genomica relativa all’oncologia pediatrica. Per ora è capace di memorizzare oltre 5.000 set di dati whole-genome, 5.000 whole-exome e 1.200 RNA-Seq.
È anche più di un semplice archivio di dati. La piattaforma fornisce infatti una serie di strumenti di analisi e funzionalità di visualizzazione che mirano ad aiutare i ricercatori a sviluppare nuovi trattamenti per le malattie pediatriche.
“St. Jude Cloud è una potente risorsa per portare avanti le ricerche e le scoperte globali”, dice Jinghui Zhang, presidente del Dipartimento di biologia computazionale di St. Jude e co-leader del progetto St. Jude Cloud. “Fornire dati di sequenziamento genomico alla comunità di ricerca globale e rendere facilmente accessibili complesse set di analisi contibuirà a conseguire progressi nell’eradicazione del cancro dell’età pediatrica”.
Zhang e il suo team a St. Jude hanno collaborato con Microsoft e DNAnexus per sviluppare una pipeline di allineamento del genoma e una variante analitica in grado di identificare dove si differenziano i genomi.
Tutti i dati su St. Jude Cloud sono presenti su Microsoft Azure che può gestire insiemi di dati su larga scala come, ad esempio, informazioni sulla genomica della popolazione. Inoltre, DNAnexus crea l’interfaccia: un sistema online sicuro in cui i ricercatori possono accedere ai dati e agli strumenti.
Oltre a tre metodi di base per esaminare i dati esistenti – per malattia, per pubblicazioni e per insieme di dati – la piattaforma consente anche una raccolta di campioni più avanzata, ad esempio mediante le mutazioni geniche o il livello di espressione. I ricercatori possono anche caricare e gestire i propri dati utilizzando strumenti di bioinformatica.
Poiché i dati e le analisi eseguite nel cloud sono potenziate da funzionalità di calcolo rapido che non richiedono il download, i ricercatori possono spostare i propri progetti molto più rapidamente.
L’ospedale ha riferito che uno scienziato di St. Jude è riuscito a replicare in pochi giorni i risultati sperimentali di uno studio sulla leucemia a cellule B che in origine aveva richiesto al team più di due anni.
Entro il 2019, St. Jude si aspetta di avere 10.000 sequenze di tutto il genoma su St. Jude Cloud.