Un’ipotesi nonadattiva e le sue previsioni
Consideriamo una posizione genomica in una regione codificante che è attualmente occupata da G e non accetta A (vedi riga superiore in Fig. 1a). Con l’aumento dell’attività di editing nella specie, una mutazione da G ad A nel sito può diventare neutra e fissa se la A risultante viene editata di nuovo in G in una proporzione sufficientemente grande di molecole di mRNA (vedi riga centrale in Fig. 1a). Dopo la sostituzione da G ad A, l’alto livello di editing nel sito sarà selettivamente mantenuto, perché è G piuttosto che A che è ammissibile a livello di mRNA. Poiché la situazione di cui sopra si applica solo alle sostituzioni nonsinonime da G ad A e all’editing accoppiato nonsinonimo da A a G, gonfia il numero di siti di editing nonsinonimi e i livelli di editing nonsinonimi rispetto ai corrispondenti valori sinonimi. Anche se in questo caso l’editing non sinonimo ha permesso la fissazione della mutazione G-to-A altrimenti deleteria, il genotipo derivato con una A genomica altamente modificata non è più adatto del genotipo originale con una G genomica. Abbiamo ipotizzato nello scenario precedente che il livello di editing sia così alto che la mutazione G-to-A, altrimenti deleteria, diventi neutra. È anche possibile che il livello di editing non sia abbastanza alto, rendendo la mutazione G-to-A leggermente deleteria (vedi riga inferiore in Fig. 1a). Una mutazione leggermente deleteria può comunque essere fissata e il livello di editing può essere selettivamente aumentato nella successiva evoluzione. Anche in questo scenario, non c’è un guadagno netto di fitness dal genotipo originale con una G genomica al genotipo derivato con una A genomica che è altamente modificata. Ci riferiamo al modello non adattivo di cui sopra, che include entrambi gli scenari descritti, come il modello “harm-permitting”, perché l’editing dell’RNA permette la fissazione di mutazioni altrimenti dannose. Anche se la possibilità di harm-permitting da RNA editing è stato proposto più volte31,38,39,40, soprattutto per quanto riguarda l’editing di trascrittomi organelli, prove empiriche che è interamente o principalmente responsabile della creazione di “segnali adattivi” di RNA editing è carente.
Data l’attività di editing eccezionalmente elevata nei tessuti neurali coleoidi25,27, ipotizziamo che la preponderanza riportata di editing non sinonimi sia spiegata dal modello di autorizzazione al danno e non sia adattativa. Per testare questa ipotesi, dividiamo l’editing non sinonimico in due categorie: restaurativo e diversificante41. L’editing riparativo converte lo stato degli aminoacidi in uno stato ancestrale (Fig. 1b), mentre l’editing diversificante converte lo stato degli aminoacidi in uno stato non ancestrale (Fig. 1c). Poiché l’editing riparativo, ma non l’editing diversificante può conferire un effetto che permette di nuocere, la nostra ipotesi prevede che la preponderanza riportata di editing non sinonimi in coleoidi è attribuibile all’editing riparativo ma non diversificante. In particolare, prevediamo che (i) la frequenza dei siti editati sia maggiore per l’editing riparativo (FR) che sinonimico (FS), e che (ii) il livello di editing mediano sia più alto per l’editing riparativo (LR) che sinonimico (LS). Prevede inoltre che (iii) la frequenza dei siti modificati non sia maggiore per l’editing diversificante (FD) rispetto a quello sinonimico (FS), e che (iv) il livello mediano di editing non sia maggiore per l’editing diversificante (LD) rispetto a quello sinonimico (LS). Al contrario, l’ipotesi adattativa non ha previsioni specifiche su FR e LR, ma predice che FD e LD sono rispettivamente maggiori di FS e LS. È degno di nota il fatto che, sebbene solo l’editing riparativo possa essere dannoso, non tutto l’editing riparativo è necessariamente dannoso. Per esempio, l’editing riparativo sarebbe neutro se ripristina una sostituzione neutra G-A.
Patterns of restorative and diversifying editing
Per testare l’ipotesi non adattativa, abbiamo analizzato i trascrittomi neurali pubblicati di sei specie di molluschi27, le cui relazioni filogenetiche sono rappresentate in Fig. 2a. Tra di loro, i quattro coleoidi hanno una diffusa codifica A-to-G editing nei tessuti neurali, mentre i due outgroups hanno sostanzialmente meno siti di editing27.
Abbiamo identificato 3587 geni ortologhi one-to-one in queste sei specie e dedotto sequenze codificanti ancestrali in tutti i nodi interni dell’albero delle specie (Fig. 2a). Abbiamo considerato un evento di editing non sinonimo in un nodo esterno dell’albero che modifica lo stato aminoacidico da X a Y come riparatore se lo stato aminoacidico dedotto basato sulla sequenza genomica è Y in qualsiasi nodo dell’albero che è ancestrale al nodo esterno focale (Fig. 1b; vedi anche Metodi), o diversificante se Y non è presente in nessun nodo dell’albero che è ancestrale al nodo esterno focale (Fig. 1c). Vale la pena notare che queste definizioni sono basate su stati aminoacidici e sono applicate solo all’editing non sinonimi. L’editing sinonimico è presumibilmente neutro, quindi non deve essere separato in editing riparativo e diversificante. Inoltre, separare l’editing sinonimico nelle due categorie sarebbe meno accurato a causa della minore affidabilità nel dedurre le sequenze ancestrali nei siti sinonimi. Delle due categorie di siti di editing non sinonimi, il numero di siti di editing diversificanti è 8,4-13,9 volte quello dei siti di editing riparativi nei quattro coleoidi (Tabella 1 supplementare).
In ciascuno dei quattro coleoidi, FR e LR sono significativamente maggiori di FS (Fig. 2b) e LS (Fig. 2c), rispettivamente. Al contrario, FD è significativamente più piccolo di FS (Fig. 2b), mentre LD non è significativamente diverso da LS (Fig. 2c). Questi risultati confermano tutte e quattro le previsioni dell’ipotesi nonadattiva e sono in contrasto con le previsioni dell’ipotesi adattiva, suggerendo fortemente che la preponderanza di editing nonsinonimi in coleoidi è spiegato dal modello di danno-permesso ed è nonadattiva. La figura 2c mostra che, sebbene LR sia significativamente più alta di LS in ogni coleoide, è inferiore al 2,5%. Ci si potrebbe chiedere se livelli mediani così bassi di editing restaurativo possano essere di tipo “harm-permitting”. Come accennato, non tutte le modifiche riparative sono necessariamente permissive, il che potrebbe spiegare perché LR non è particolarmente alta. Tuttavia, la Fig. 2c rivela una frazione maggiore di editing riparativo rispetto all’editing sinonimico con livelli di editing apprezzabili. Per esempio, nel calamaro, il 33,37% e il 13,31% dei siti di editing riparativo ma solo il 22,97% e il 6,74% dei siti di editing sinonimi hanno livelli di editing >5% e >20%, rispettivamente. A seconda del danno della mutazione G-A e della dominanza relativa delle isoforme A e G, questi livelli apprezzabili di editing A-G potrebbero aumentare sostanzialmente la probabilità di fissazione della mutazione G-A. Va anche notato che l’ipotesi del danno-permesso è proposta come alternativa all’ipotesi adattativa. Se livelli moderati di editing non sinonimi potrebbero essere benefici come affermato dall’ipotesi adattativa, non c’è ragione per cui non potrebbero essere dannosi. Inoltre, la tendenza generale di LR > LS e LD < LS supporta l’ipotesi del danno-permesso rispetto all’ipotesi adattativa.
Per esaminare la robustezza dei nostri risultati, abbiamo condotto quattro analisi aggiuntive. In primo luogo, abbiamo esaminato rispettivamente i siti di editing che sono specifici per ciascuno dei quattro coleoidi, perché gli eventi di editing specie-specifici hanno età evolutive simili, permettendo confronti più equi. I risultati ottenuti sono molto simili a quelli della Fig. 2 e sono robusti a potenziali errori di identificazione dell’editing specie-specifico (Fig. 1 supplementare). In secondo luogo, abbiamo sondato gli eventi di editing identificati da singoli tessuti in bimac. FR > FS e FD < FS tengono attraverso i tessuti, ma i confronti dei livelli di editing sono per lo più non significativi, probabilmente a causa della ridotta potenza statistica a seguito di dimensioni del campione diminuito (Tabella supplementare 2). In terzo luogo, perché i livelli di editing dei siti di editing vicini possono essere co-affetti da una mutazione, che ridurrebbe il potere statistico nel confronto dei siti di editing sinonimi con non sinonimi, abbiamo confrontato i siti di editing sinonimi in una metà del set di geni con siti di editing non sinonimi nell’altra metà. In particolare, abbiamo classificato tutti i geni in base al rapporto dN/dS tra gli ortologhi del polpo e del calamaro, e rispettivamente raggruppato i geni con i ranghi dispari nel bin 1 e quelli con i ranghi pari nel bin 2. Abbiamo poi confrontato l’editing sinonimo nel bin 1 con quello non sinonimo nel bin 2, così come l’editing sinonimo nel bin 2 con quello non sinonimo nel bin 1. I risultati (Fig. 2 supplementare) sono simili a quelli ottenuti da tutti i siti di editing (Fig. 2). In quarto luogo, abbiamo rispettivamente studiato FR/FS e FD/FS in cinque intervalli di livello di editing (0-20%, 20-40%, 40-60%, 60-80% e 80-100%) in ogni coleoide (Fig. 3 supplementare). Sia FR/FS che FD/FS generalmente aumentano con il livello di editing. Anche se FR/FS supera quasi sempre 1, FD/FS è più piccolo di 1, tranne quando il livello di editing supera il 60%. È importante sottolineare che solo una piccola percentuale di siti di editing diversificati in un coleoide rientra in questa gamma di livelli di editing (Tabella 3 supplementare), suggerendo che la stragrande maggioranza dell’editing diversificante non è adattivo (vedi sotto per stime quantitative).
Sostituzioni accelerate nonsinonime G-to-A
Il modello di ammissione del danno prevede inoltre che il tasso di sostituzione nonsinonima G-to-A rispetto a quello di sostituzione sinonima G-to-A (dN/dS per G-to-A) dovrebbe essere elevato, perché l’elevata attività di editing rende accettabili alcune mutazioni nonsinonime G-to-A altrimenti deleterie. Inoltre, questo aumento dovrebbe essere particolarmente pronunciato nei geni espressi esclusivamente nei tessuti neurali ma non nei geni non espressi nei tessuti neurali, perché l’alta attività di editing è finora osservata solo nei tessuti neurali25,27. Tuttavia, poiché solo il bimaco e il calamaro hanno a disposizione dati di RNA-sequencing di diversi tessuti non neurali e poiché i geni inespressi nei tessuti neurali non sono presenti nei dati di sequenza dei trascritti del polpo e della seppia, e quindi sono esclusi dai nostri allineamenti, abbiamo dovuto definire due gruppi di geni con specificità relativamente alta e relativamente bassa nell’espressione neurale, rispettivamente. I geni con alta specificità di espressione neurale sono espressi esclusivamente nei tessuti neurali nel bimaco o nel calamaro, mentre quelli con bassa specificità di espressione neurale sono espressi sia nei tessuti neurali che non neurali sia nel bimaco che nel calamaro. Il modello “harm-permitting” predice che dN/dS per G-to-A è maggiore per i geni con specificità di espressione neurale relativamente alta che per quelli con specificità di espressione neutra relativamente bassa. Come il danno-permettendo effetto è presente solo quando una mutazione G-to-A in un sito è deleterio senza editing, ci siamo concentrati su siti non sinonimi che sono conservati nelle due specie outgroup (cioè, nautilus, lepre di mare, e il nodo immediatamente ancestrale della specie focale condividere lo stesso stato pre-editing) per aumentare la sensibilità del nostro test. Inoltre, l’aumento di dN/dS dovrebbe essere specifico per i cambiamenti da G ad A, perché i potenziali danni di altri cambiamenti come da C/T ad A e da G a C/T non possono essere alleviati dall’editing da A a G.
A questo scopo, abbiamo considerato tutti i sei rami discendenti dall’antenato comune dei quattro coleoidi. Abbiamo calcolato dN e dS di ciascuno di questi rami usando le sequenze ancestrali estese e dedotte, e poi abbiamo calcolato dN/dS dividendo il dN totale per il dS totale di questi rami. A sostegno della nostra previsione, dN/dS per i cambiamenti G-to-A è maggiore per i geni di specificità di espressione neurale relativamente alta rispetto a quelli di specificità relativamente bassa (Fig. 3). Con rispettivamente bootstrapping i due gruppi di geni 200 volte, abbiamo trovato che la differenza di cui sopra è statisticamente significativo (P = 0.015). Al contrario, nessuna differenza significativa in dN/dS esiste tra i due gruppi di geni quando vengono considerati i cambiamenti C/T-to-A o G-to-C/T (Fig. 3). È degno di nota che dN/dS < 1 in tutti i casi in Fig. 3, coerente con il modello di danno-permesso che non coinvolge la selezione positiva.
Il potenziale beneficio di editing condiviso tra le specie
È stato suggerito che l’editing condiviso tra più specie è probabilmente vantaggioso, perché altrimenti lo stato di editing è improbabile che sia evolutivamente conservato36. A sostegno di questo suggerimento è stata la constatazione che, anche nei mammiferi, dove la maggior parte dell’editing non sinonimi appare neutro o deleterio, la frequenza dei siti conservati soggetti a editing non sinonimi sia nell’uomo che nel topo supera significativamente la frequenza dei siti conservati soggetti a editing sinonimi in entrambe le specie36. Un fenomeno simile è stato riportato nei moscerini della frutta23. In coleoidi, una frazione considerevole di editing nonsinonimi è condiviso da almeno due specie e siti altamente modificati tendono ad essere condivisi27. Per comprendere le potenziali forze evolutive che mantengono l’editing di RNA in siti specifici attraverso più coleoidi, abbiamo analizzato l’editing condiviso da un clade di due o più specie.
Un evento di editing nonsinonimo condiviso da un clade di specie che modifica lo stato aminoacidico da X a Y è considerato riparativo se la sequenza genomica dedotta basata stato aminoacidico è Y in qualsiasi nodo dell’albero che è ancestrale al più recente antenato comune del clade, o diversificante se Y non è presente in nessuno di questi nodi ancestrali. Nello studio dell’editing condiviso, abbiamo considerato il livello medio di editing nel clade in cui l’editing è condiviso. Per i siti di editing condivisi tra il polpo e il bimaco, e quelli condivisi tra il calamaro e la seppia, FR e FD sono entrambi significativamente più piccoli di FS (Fig. 4a). Al contrario, LR e LD sono entrambi significativamente maggiori di LS (Fig. 4b). Per il sottoinsieme dei siti di editing condivisi di cui sopra che sono condivisi da tutti e quattro i coleoidi, FD e LD sono rispettivamente significativamente maggiori di FS (Fig. 4a) e LS (Fig. 4b), così sono FR (Fig. 4a) e LR (Fig. 4b). Un FD significativamente maggiore di FS per l’editing condiviso potrebbe essere causato da (i) selezione positiva che promuove la fissazione iniziale di mutazioni che portano all’editing nonsinonimi e/o (ii) selezione purificante che impedisce la perdita di editing nonsinonimi presumibilmente benefici; quindi, è un chiaro indicatore di editing nonsinonimi adattivo. Un LD significativamente maggiore di LS per l’editing condiviso potrebbe essere causato da (i) selezione positiva che promuove l’aumento dei livelli di editing di editing nonsinonimi presumibilmente benefici, (ii) selezione purificante che impedisce la diminuzione dei livelli di editing di editing nonsinonimi presumibilmente benefici, (iii) selezione purificante che impedisce preferenzialmente la perdita di editing nonsinonimi di alto livello presumibilmente perché alti livelli di editing sono associati a maggiori benefici rispetto ai bassi livelli di editing, e/o (iv) selezione positiva che promuove preferenzialmente la perdita di editing nonsinonimi di basso livello, probabilmente perché una sostituzione A-G è favorita in un sito modificato, specialmente quando il livello di editing è basso. Indipendentemente da ciò, un LD significativamente maggiore rispetto al LS indica anche un editing non sinonimico adattivo. Quindi, la modifica non sinonima condivisa da tutti e quattro i coleoidi mostra segnali adattativi forti e coerenti, suggerendo che una grande frazione è adattativa. In confronto, l’editing non sinonimico condiviso tra il polpo e il bimaco, e quello condiviso tra il calamaro e la seppia mostrano alcuni ma non tutti i segni di adattamento, e i segnali adattativi sono molto più deboli, suggerendo che solo una frazione minore è adattativa.
Qual è il beneficio generale dell’editing condiviso che mostra segnali adattativi? Esistono due ipotesi. In primo luogo, l’editing può essere vantaggioso a causa della diversità proteica intra-organismo creato25,27,32,42. Cioè, l’editing permette l’esistenza di due isoforme proteiche per sito editato in un organismo, che può conferire una maggiore fitness, analogo al vantaggio eterozigote in siti polimorfici. In alternativa, l’editing offre una nuova isoforma che può essere semplicemente più adatta dell’isoforma non modificata. In quest’ultima ipotesi, il beneficio dell’editing è paragonabile a quello di una sostituzione nucleotidica. Per distinguere tra queste due ipotesi, ci siamo concentrati sui siti che sono modificati in almeno tre dei quattro coleoidi, perché l’editing dovrebbe essere esistito in questi siti nell’antenato comune delle quattro specie secondo il principio di parsimonia (Fig. 2a). Abbiamo poi stimato la frequenza di sostituzione dell’editing con una sostituzione A-G in una qualsiasi delle quattro specie. Ci si aspetta che tali sostituzioni siano più o meno neutre per l’editing sinonimo. Per l’editing non sinonimo, tali sostituzioni sono deleterie sotto la prima ipotesi a causa della perdita di diversità proteica, ma sono neutrali sotto la seconda ipotesi. Quindi, la prima ipotesi prevede una frequenza inferiore di tali sostituzioni per l’editing non sinonimi rispetto all’editing sinonimi, mentre la seconda ipotesi prevede frequenze uguali di tali sostituzioni per l’editing sinonimi e non sinonimi.
Interessante, la frequenza di tali sostituzioni per l’editing non sinonimi è significativamente maggiore di quella per l’editing sinonimi in un test esatto di Fisher a due code (Fig. 4c e Tabella 4 supplementare). Poiché è l’editing diversificante condiviso per il quale la natura del beneficio è in questione, abbiamo ristretto l’analisi al solo editing diversificante, ma abbiamo ottenuto un risultato simile (Fig. 4c e Tabella 4 supplementare). È degno di nota che nessun editing sinonimo o non sinonimo è stato trovato per essere sostituito con una sostituzione A-to-C/T tra questo set di siti (Tabella supplementare 4). La nostra scoperta suggerisce che, se non altro, l’editing non sinonimo è più probabile che venga sostituito con una sostituzione A-G rispetto all’editing sinonimo, probabilmente perché avere una G genomica è superiore ad avere una A genomica che non può essere modificata in G in tutte le molecole di mRNA. In altre parole, i nostri risultati rifiutano la prima ipotesi e suggeriscono che la natura del beneficio della modifica adattativa A-to-G è simile a quella della stessa sostituzione nucleotidica, anche se la dimensione del beneficio dalla prima è più piccola di quella dalla seconda. Inoltre, la scoperta in Fig. 4c suggerisce che la FD significativamente maggiore della FS per l’editing condivisa tra tutti e quattro i coleoidi è meglio spiegata dalla selezione positiva che promuove la fissazione iniziale delle mutazioni che hanno portato al benefico editing nonsinonimi che la selezione purificante che impedisce la perdita del benefico editing nonsinonimi.