Algoritmo Global Score studia le interazioni tra RNA e proteine


    Introduzione

    Ogni cellula del corpo umano contiene al suo interno un manuale di istruzioni per svolgere tutte quelle azioni grazie alle quali può mantenersi funzionale e in vita. Questo manuale di istruzioni è denominato genoma ed è composto dal DNA ereditato dai nostri genitori. Se immaginiamo la cellula come un cantiere edile in un’incessante attività di costruzione, manutenzione e riparazione, le istruzioni dettate dal genoma servono a produrre quella che rappresenterebbe la manodopera al lavoro, ovvero le proteine.

    A partire dal DNA infatti possono essere sintetizzati due gruppi di molecole: gli RNA codificanti, usati a loro volta per sintetizzare le proteine, e gli RNA non-codificanti, molte delle cui funzioni non sono ancora state del tutto chiarite. In particolare, i più grandi componenti di questo misterioso gruppo, denominati RNA lunghi non-codificanti, sono da tempo oggetto di intensi studi proprio per la loro oscura e sfuggevole natura che ne rende estremamente difficile l’indagine in laboratorio.

    Sono quindi gli RNA lunghi non-codificanti ad aiutare le proteine nel cantiere cellulare?

     

    Come predire l’eventuale interazione tra le proteine e un RNA lungo non codificante  attraverso l’algoritmo Global Score

     

    Recentemente, gli scienziati italiani del CRG (Centre for Genomic Regulation) di Barcellona insieme ai colleghi dell’EMBL (European Molecular Biology Laboratory) di Monterotondo e del Caltech (California Institute of Technology) hanno realizzato un algoritmo computazionale, denominato Global Score, capace di predire se un RNA lungo non-codificante sia in grado di interagire con una o più proteine, nel qual caso suggerirebbe una forte implicazione funzionale all’interno della cellula.

    La validità di questo metodo predittivo è stata dimostrata dagli autori dello studio attraverso degli esperimenti di laboratorio all’avanguardia, grazie ai quali le interazioni predette sullo schermo di un computer sono state successivamente osservate in provetta.

    Global Score permette di stabilire l’esatta “posizione” di contatto tra una proteina e l’RNA lungo non codificante

    Al di là di una generica predizione di interazione tra due tipi di molecole, Global Score permette di individuare esattamente il sito in cui una proteina stabilirà un contatto fisico lungo l’estesa massa di RNA lungo non-codificante in esame.

    Conoscere questi siti di legame è molto importante per manipolare e alterare le interazioni molecolari in laboratorio allo scopo di caratterizzarne meglio proprietà e conseguenze soprattutto a livello patologico.

    Le interazioni tra proteine ed RNA possono essere infatti determinanti per svolgere funzioni cruciali all’interno della cellula ma a volte possono anche essere aberranti e del tutto indesiderate. Possedere quindi uno strumento che consenta di distinguere tra interazioni “buone” e interazioni “cattive” rappresenta un grande passo avanti per la ricerca scientifica in diversi settori, dagli studi sul cancro a quelli sulle  malattie neurodegenerative.

    Global Score è innanzitutto un metodo computazionale

    Global Score è un metodo computazionale che risiede nel dominio della bioinformatica, un campo interdisciplinare delle scienze che combina insieme informatica, statistica, matematica e ingegneria, allo scopo di analizzare e interpretare i dati biologici.

    La ricerca a livello internazionale coinvolge gruppi di scienziati che conducono non solo esperimenti con cellule e organismi interi, ma anche esperimenti in silico, che prevedono simulazioni al computer attraverso l’impiego di sofisticati modelli matematici.
     

    Sfide e difficoltà nell’implementazione di metodi matematici efficaci

    La bioinformatica consente di sviluppare questo tipo di metodi agevolando, ad esempio, la messa a punto degli esperimenti e alleviando quindi la ricerca da diverse difficoltà tecniche e soprattutto dagli ingenti costi che altrimenti si troverebbe ad affrontare. Nonostante ciò, l’implementazione di metodi computazionali non è affatto un compito semplice e molte applicazioni bioinformatiche risentono delle difficoltà legate alla complessità del problema e spesso ai considerevoli tempi di calcolo richiesti.

     

    Le enormi dimensioni dell’RNA richiedono un’elevata potenza di calcolo per individuarne la struttura

    Lo studio in silico delle interazioni tra proteine ed RNA lunghi non-codificanti è proprio uno di questi esempi.

    La difficoltà in questo caso è rappresentata dalle dimensioni titaniche dell’RNA: quanto più estesa è la sua mole, tanta più potenza di calcolo sarà necessaria per individuare la struttura assunta dalla molecola.

    Conoscere la struttura dell’RNA è fondamentale per predirne l’interazione con le proteine (n.d.a. le proteine d’altro canto hanno una struttura modulare e quindi relativamente più facile da predire).

     

    Assieme agli RNA codificanti (o messaggeri, mRNA), grandi sviluppi nel campo della Genomica hanno portato alla scoperta di molti RNA non-codificanti (ncRNA) di diverse dimensioni: lunghi e piccoli.Fig.1 Assieme agli RNA codificanti (o messaggeri, mRNA), grandi sviluppi nel campo della Genomica hanno portato alla scoperta di molti RNA non-codificanti (ncRNA) di diverse dimensioni: lunghi ncRNA (o long ncRNA, lncRNA) e piccoli ncRNA (o micro RNA, miRNA). Molti di questi ncRNA sono in grado di agire sul DNA, sulle diverse classi di RNA, e sulle proteine, influenzando quindi la loro espressione e funzione.

     

    Come funziona Global Score?

    Global Score è il primo metodo bioinformatico che propone una soluzione a questo specifico problema di dimensioni. Come è noto, la soluzione di un problema è spesso la più semplice. La soluzione di Global Score prevede infatti la frammentazione della lunga molecola di RNA per poter analizzare il contributo delle strutture locali dei piccoli frammenti ottenuti alla grande struttura globale.

     

    Perché è importante il lavoro di ricerca svolto su Global Score?

    Il lavoro di ricerca svolto attraverso l’ideazione di Global Score consente di analizzare grosse molecole impiegando risorse di calcolo ordinarie, un fattore che rende questo algoritmo un passaggio rilevante nel campo della bioinformatica applicata allo studio degli RNA lunghi non-codificanti.

    Studi precedenti: il metodo catRAPID

    Il laboratorio che ha condotto lo studio, diretto dal professor Gian Gaetano Tartaglia,, vanta una storica presenza nel settore dei metodi predittivi di interazione tra proteine ed RNA. Global Score è l’ultima creazione di un laboratorio che negli anni ha ideato vari metodi computazionali allo scopo di affinare l’accuratezza di questa particolare tecnica predittiva. Nel 2011 veniva alla luce un metodo denominato catRAPID, pioniere dei tuttora pochi metodi computazionali disponibili per questo tipo di predizioni.

     

    catRAPID, un metodo applicato allo studio di diverse malattie

    Nonostante le limitazioni dettate delle dimensioni dell’RNA, catRAPID è stato applicato estensivamente allo studio delle malattie neurodegenerative come il Parkinson, l’Alzheimer, il morbo di Creutzfeldt-Jakob, la demenza frontotemporale e la sindrome del cromosoma X fragile.. Grazie a Global Score queste difficoltà sono state superate e un ampio ventaglio di nuove interazioni possono finalmente essere predette al computer.

    La convalida sperimentale di Global Score

    La validità di questo nuovo metodo è stata dimostrata attraverso prove sperimentali. In particolare, gli studi del laboratorio sono stati incentrati su un RNA lungo non-codificante denominato Xist, il quale gioca un ruolo fondamentale nel processo fisiologico che inattiva uno dei due cromosomi X presenti nei nuclei delle cellule dei mammiferi femmina.

    L’inattivazione è necessaria perché la coppia di cromosomi porta gli stessi geni che quindi risulterebbero pericolosamente duplicati.

    Per poter “spegnere” uno dei due cromosomi X, l’RNA lungo non-codificante ricopre il cromosoma lungo tutta la sua superficie grazie all’aiuto di alcune proteine di cui non si conosce l’identità. Per poterle individuare si dovrebbero condurre esperimenti estremamente complicati e costosi, i quali oltretutto sono soggetti a una non trascurabile variabilità di protocollo e quindi di risultato finale.

     

    La soluzione dunque è predire con Global Score le interazioni più forti tra Xist e tutte le proteine del nucleo cellulare per poi condurre esperimenti mirati. Il risultato finale di questo approccio ha consentito non solo di individuare le proteine interagenti con Xist, ma anche di confermare implicitamente l’esattezza delle predizioni di Global Score.

    Autori dello studio:

    Davide Cirillo [1,2], Mario Blanco [3], Alexandros Armaos [1,2], Andreas Buness [4], Philip Avner [4], Mitchell Guttman [3], Andrea Cerase [4], Gian Gaetano Tartaglia [1,2,5]

    1. Centre for Genomic Regulation (CRG), The Barcelona Institute of Science and Technology, Barcelona, Spain.
    2. Universitat Pompeu Fabra (UPF), Barcelona, Spain.
    3. Division of Biology and Biological Engineering, California Institute of Technology, Pasadena, California.
    4. EMBL-Monterotondo, Rome, Italy.
    5. Institucio Catalana de Recerca i Estudis Avançats (ICREA), Barcelona, Spain.

     

    Riferimenti

    Quantitative predictions of protein interactions with long noncoding RNAs - Cirillo D, Blanco M, Armaos A, Buness A, Avner P, Guttman M, Cerase A, Tartaglia GG.
    Nat Methods. 2017.

    A high-throughput approach to profile RNA structure - Delli Ponti R, Marti S, Armaos A, Tartaglia GG. Nucleic Acids Res. 2016.