Uma hipótese não adaptativa e suas previsões
Deixe-nos considerar uma posição genômica em uma região codificadora que é atualmente ocupada por G e não aceita A (ver linha superior na Fig. 1a). medida que a atividade de edição na espécie aumenta, uma mutação de G para A no local pode se tornar neutra e fixa se o A resultante for editado de volta para G em uma proporção suficientemente grande de moléculas de mRNA (ver linha do meio na Fig. 1a). Na substituição de G para A, o alto nível de edição no local será mantido seletivamente, porque é G em vez de A que é permitido no nível de mRNA. Como a situação acima se aplica apenas às substituições não-sinônimas de G para A e à edição A para G acoplada não-sinônima, ela inflaciona o número de sites de edição não-sinônima e níveis de edição não-sinônima em relação aos valores sinônimos correspondentes. Embora aqui a edição não-sinônima tenha permitido a fixação da mutação G-para-A deletéria, o genótipo derivado com um A genômico altamente editado não é mais adequado do que o genótipo original com um G genômico. Nós assumimos no cenário acima que o nível de edição é tão alto que a mutação de G para A, que de outra forma seria deletéria, torna-se neutra. Também é possível que o nível de edição não seja alto o suficiente, tornando a mutação G-para-A ligeiramente deletério (ver linha inferior na Fig. 1a). Uma mutação ligeiramente deletéria pode, no entanto, ser corrigida e o nível de edição pode ser aumentado seletivamente na evolução subsequente. Mesmo neste cenário, não há ganho líquido de aptidão do genótipo original com um G genômico para o genótipo derivado com um A genômico que é altamente editado. Referimo-nos ao modelo não adaptativo acima, incluindo ambos os cenários descritos como o modelo prejudicial, pois a edição de RNA permite a fixação de mutações de outra forma prejudiciais. Embora a possibilidade de danos-permitantes pela edição de RNA tenha sido proposta várias vezes31,38,39,40, especialmente no que diz respeito à edição de transcriptomas de organelas, faltam evidências empíricas de que ela é total ou primariamente responsável pela criação de “sinais adaptativos” da edição de RNA.
Dada a atividade de edição excepcionalmente alta nos tecidos neurais coleoidais25,27, nós colocamos a hipótese de que a preponderância relatada da edição não-sinônima é explicada pelo modelo prejudicial-permitente e é não-adaptável. Para testar essa hipótese, dividimos a edição não-sinônima em duas categorias: restauradora e diversificadora41. A edição restaurativa converte o estado do aminoácido de volta a um estado ancestral (Fig. 1b), enquanto a edição diversificativa converte o estado do aminoácido a um estado não-ancestral (Fig. 1c). Como a edição restauradora, mas não diversificadora, pode conferir um efeito prejudicial, nossa hipótese prevê que a preponderância relatada da edição não-sinônima em coleoides é atribuível à edição restauradora, mas não diversificadora. Em particular, nós prevemos que (i) a frequência de sites editados é maior para edição restauradora (FR) do que para edição sinônima (FS), e que (ii) o nível mediano de edição é maior para edição restauradora (LR) do que para edição sinônima (LS). Prevê ainda que (iii) a frequência dos sites editados não seja maior para a edição de diversificação (FD) do que para a edição de sinônimos (FS), e que (iv) o nível de edição da mediana não seja maior para a edição de diversificação (LD) do que para a edição de sinônimos (LS). Pelo contrário, a hipótese adaptativa não tem previsões específicas sobre FR e LR, mas prevê que FD e LD são respectivamente maiores do que FS e LS. É de salientar que embora apenas a edição restaurativa possa ser prejudicial, nem toda a edição restaurativa é necessariamente prejudicial. Por exemplo, a edição restauradora seria neutra se restaurasse uma substituição neutra de G para A.
Patterns of restorative and diversifying editing
Para testar a hipótese não adaptativa, analisamos as transcriptomas neurais publicadas de seis espécies de moluscos27, cujas relações filogenéticas estão representadas na Fig. 2a. Dentre eles, os quatro coleoides têm codificação A-to-G de edição difundida nos tecidos neurais, enquanto os dois outgroups têm substancialmente menos locais de edição27,
Identificamos 3587 genes ortológicos um-para-um nessas seis espécies e inferimos seqüências de codificação ancestrais em todos os nós interiores da árvore da espécie (Fig. 2a). Consideramos um evento de edição não-sinônimo em um nó exterior da árvore que modifica o estado de aminoácidos de X para Y como restaurador se o estado de aminoácidos baseado na sequência genômica inferida for Y em qualquer nó da árvore que é ancestral ao nó focal exterior (Fig. 1b; ver também Métodos), ou diversificando se Y não estiver presente em nenhum nó da árvore que é ancestral ao nó focal exterior (Fig. 1c). Vale ressaltar que estas definições são baseadas em estados de aminoácidos e são aplicadas apenas à edição não-sinônima. A edição sinônima é presumivelmente neutra, portanto não precisa ser separada em edição restauradora e diversificadora. Além disso, a separação da edição sinônima nas duas categorias seria menos precisa devido à menor confiabilidade na inferência de seqüências ancestrais em sítios sinônimos. Das duas categorias de sites de edição não-sinônima, o número de sites de edição diversificada é 8,4-13,9 vezes o dos sites de edição restauradora nos quatro coleoides (Tabela Suplementar 1).
Em cada um dos quatro coleoides, FR e LR são significativamente maiores que FS (Fig. 2b) e LS (Fig. 2c), respectivamente. Em contraste, FD é significativamente menor que FS (Fig. 2b), enquanto LD não é significativamente diferente de LS (Fig. 2c). Estes resultados confirmam as quatro previsões da hipótese não-adaptativa e estão em desacordo com as previsões da hipótese adaptativa, sugerindo fortemente que a preponderância da edição não-sinônima em coleoides é explicada pelo modelo harm-permitting e é não-adaptativa. A Figura 2c mostra que, embora o LR seja significativamente superior ao LS em cada coleoide, ele é inferior a 2,5%. Pode-se perguntar se esses baixos níveis medianos de edição restaurativa podem ser prejudiciais à saúde. Como mencionado, nem toda a edição restauradora é necessariamente prejudicial, o que poderia explicar porque o LR não é particularmente alto. No entanto, a Fig. 2c revela uma fração maior de edição restaurativa do que a edição sinônima com níveis de edição apreciáveis. Por exemplo, na lula, 33,37% e 13,31% dos sites de edição restaurativa, mas apenas 22,97% e 6,74% dos sites de edição sinônima têm níveis de edição >5% e >20%, respectivamente. Dependendo do dano da mutação G-to-A e do domínio relativo das isoformas A e G, esses níveis apreciáveis de edição A-to-G poderiam aumentar substancialmente a probabilidade de fixação da mutação G-to-A. Também deve ser notado que a hipótese de dano é proposta como uma alternativa à hipótese adaptativa. Se níveis moderados de edição não-sinônima poderiam ser benéficos como afirmado pela hipótese adaptativa, não há razão para que não possam ser prejudiciais. Além disso, a tendência geral de LR > LS e LD < LS suporta a hipótese prejudicial em relação à hipótese adaptativa.
Para examinar a robustez dos nossos resultados, realizamos quatro análises adicionais. Primeiro, examinamos respectivamente locais de edição que são específicos para cada um dos quatro coleoides, porque os eventos de edição específicos das espécies têm idades evolutivas semelhantes, permitindo comparações mais justas. Os resultados obtidos são muito semelhantes aos da Fig. 2 e são robustos a potenciais erros de identificação da edição específica da espécie (Fig. 1 suplementar). Em segundo lugar, sondamos eventos de edição identificados a partir de tecidos individuais em bimac. FR > FS e FD < FS são mantidos através dos tecidos, mas as comparações de nível de edição são na maioria não significativas, provavelmente devido ao reduzido poder estatístico como resultado da diminuição do tamanho das amostras (Tabela Suplementar 2). Terceiro, como os níveis de edição de sites vizinhos podem ser co-afectados por uma mutação, o que reduziria o poder estatístico na comparação de sinônimos com sites de edição não-sinônimos, nós comparamos sites de edição de sinônimos em uma metade do conjunto genético com sites de edição não-sinônimos na outra metade. Especificamente, classificamos todos os genes pela razão dN/dS entre o polvo e o ortograma de lula, e respectivamente os genes agrupados com posições ímpares no bin 1 e aqueles com posições pares no bin 2. Comparamos então a edição sinônima no bin 1 com a edição não-sinônima no bin 2, assim como a edição sinônima no bin 2 com a edição não-sinônima no bin 1. Os resultados (Fig. 2 Complementar) são semelhantes aos obtidos em todos os sites de edição (Fig. 2). Quarto, investigamos respectivamente FR/FS e FD/FS em cinco faixas de nível de edição (0-20%, 20-40%, 40-60%, 60-80%, e 80-100%) em cada coleoide (Suplemento Fig. 3). Ambos FR/FS e FD/FS geralmente aumentam com o nível de edição. Embora FR/FS quase sempre exceda 1, FD/FS é menor que 1, exceto quando o nível de edição excede 60%. É importante salientar que apenas alguns por cento dos locais de edição diversificada em um coleoide caem nesta faixa de nível de edição (Tabela Complementar 3), sugerindo que a grande maioria da edição diversificada é não-adaptativa (veja abaixo as estimativas quantitativas).
Substituições não-sinônimas de G para A aceleradas
O modelo que gera danos prevê ainda que a taxa de substituição não-sinônima de G para A em relação à de substituição sinônima de G para A (dN/dS para G para A) deve ser elevada, porque a alta atividade de edição torna aceitáveis algumas mutações não-sinônimas de G para A deletérias. Além disso, essa elevação deve ser particularmente pronunciada em genes exclusivamente expressos em tecidos neurais, mas não em genes não expressos em tecidos neurais, pois a alta atividade de edição é até o momento observada apenas nos tecidos neurais25,27. Entretanto, como apenas bimac e lula possuem dados de seqüenciamento de RNA disponíveis de vários tecidos não neurais e como os genes nãoexpressos nos tecidos neurais não estão nos dados da seqüência de transcrição do polvo e do choco, e portanto são excluídos de nossos alinhamentos, tivemos que definir dois grupos de genes com especificidades relativamente altas e relativamente baixas na expressão neural, respectivamente. Os genes com altas especificidades de expressão neural são expressos exclusivamente em tecidos neurais no bimac ou lula, enquanto aqueles com baixas especificidades de expressão neural são expressos tanto em tecidos neurais como não neurais no bimac e na lula. O modelo harm-permitting prevê que o dN/dS para G-to-A é maior para genes com especificidades de expressão neural relativamente altas do que para aqueles com especificidades de expressão neutra relativamente baixas. Como o efeito prejudicial só está presente quando uma mutação G-to-A em um local é deletério sem edição, nós nos concentramos em locais não-sinônimos que são conservados nas duas espécies fora do grupo (i.e., nautilus, lebre do mar e o nó imediatamente ancestral da espécie focal compartilham o mesmo estado de pré-edição) para aumentar a sensibilidade do nosso teste. Além disso, a elevação em dN/dS deve ser específica para mudanças G-to-A, porque os danos potenciais de outras mudanças como C/T-to-A e G-to-C/T não podem ser aliviados pela edição A-to-G.
Para este fim, consideramos todos os seis ramos descendentes do ancestral comum dos quatro coleoides. Calculamos dN e dS de cada um desses ramos usando as seqüências ancestrais existentes e inferidas, e depois calculamos o dN/dS dividindo o dN total pelo dS total desses ramos. Em apoio à nossa previsão, o dN/dS para mudanças de G-to-A é maior para genes de especificidade de expressão neural relativamente alta do que para genes de especificidade relativamente baixa (Fig. 3). Ao iniciarmos os dois grupos de genes 200 vezes, respectivamente, verificamos que a diferença acima é estatisticamente significativa (P = 0,015). Pelo contrário, não existe diferença significativa em dN/dS entre os dois grupos de genes quando C/T para A muda ou G para C/T muda (Fig. 3). É interessante notar que dN/dS < 1 em todos os casos na Fig. 3, consistente com o modelo harm-permitting que não envolve seleção positiva.
O benefício potencial da edição compartilhada entre espécies
Tem sido sugerido que a edição compartilhada entre múltiplas espécies é provavelmente benéfica, pois, caso contrário, é improvável que o estado de edição seja conservado evolutivamente36. Em apoio a esta sugestão foi a constatação de que, mesmo nos mamíferos, onde a maioria da edição não-sinônima parece neutra ou deletéria, a frequência de sites conservados sujeitos a edição não-sinônima tanto em humanos quanto em ratos excede significativamente a frequência de sites conservados sujeitos a edição sinônima em ambas as espécies36. Um fenômeno similar foi relatado em moscas da fruta23. Em coleoides, uma fração considerável da edição não-sinônima é compartilhada por pelo menos duas espécies e sites altamente editados tendem a ser compartilhados27. Para compreender as potenciais forças evolutivas mantendo a edição de RNA em locais específicos através de múltiplos coleoides, analisamos a edição compartilhada por um clade de duas ou mais espécies.
Um evento de edição não-sinônimo compartilhado por um clade de espécies que modifica o estado de aminoácidos de X para Y é considerado restaurador se o estado de aminoácidos baseado na sequência genômica inferida for Y em qualquer nó da árvore que seja ancestral do mais recente ancestral comum do clade, ou diversificando se Y não estiver presente em nenhum desses nós ancestrais. No estudo da edição compartilhada, consideramos o nível médio de edição no clade onde a edição é compartilhada. Para os locais de edição compartilhados entre o polvo e o bimac, e aqueles compartilhados entre a lula e o choco, FR e FD são ambos significativamente menores que FS (Fig. 4a). Em contraste, LR e LD são ambos significativamente maiores do que LS (Fig. 4b). Para o subconjunto dos sites de edição compartilhados acima que são compartilhados pelos quatro coleoides, FD e LD são respectivamente significativamente maiores que FS (Fig. 4a) e LS (Fig. 4b), assim como FR (Fig. 4a) e LR (Fig. 4b). Um FD significativamente maior que FS para edição compartilhada poderia ser causado por (i) seleção positiva promovendo a fixação inicial de mutações que levam à edição não-sinônima e/ou (ii) seleção purificadora impedindo a perda da edição presumivelmente benéfica não-sinônima; portanto, é um claro indicador de edição adaptativa não-sinônima. Um LD significativamente superior ao LS para edição compartilhada poderia ser causado por (i) seleção positiva promovendo o aumento dos níveis de edição presumivelmente benéfica edição não-sinônima, (ii) purificando a seleção impedindo a diminuição dos níveis de edição presumivelmente benéfica edição não-sinônima, (iii) purificando a seleção preferencialmente prevenindo a perda da edição não-sinônima de alto nível, presumivelmente porque altos níveis de edição estão associados a maiores benefícios do que baixos níveis de edição, e/ou (iv) seleção positiva promovendo preferencialmente a perda da edição não-sinônima de baixo nível, provavelmente porque uma substituição A-to-G é favorecida em um site editado, especialmente quando o nível de edição é baixo. Independentemente disso, um LD significativamente superior ao LS também indica uma edição adaptativa não-sinônima. Assim, a edição não-sinônima compartilhada pelos quatro coleoides mostra sinais adaptativos fortes e consistentes, sugerindo que uma grande fração é adaptável. Em comparação, a edição não-sinônima compartilhada entre o polvo e o bimac, e aquela compartilhada entre a lula e o choco mostram alguns sinais de adaptação, mas não todos, e os sinais adaptativos são muito mais fracos, sugerindo que apenas uma fração menor é adaptativa.
Qual é o benefício geral da edição compartilhada que mostra sinais adaptativos? Existem duas hipóteses. Primeiro, a edição pode ser benéfica devido à diversidade de proteínas intra-organismo criadas25,27,32,42. Ou seja, a edição permite a existência de duas isoformas proteicas por sítio editado em um organismo, o que pode conferir uma maior aptidão, análoga à vantagem heterozigota em sítios polimórficos. Alternativamente, a edição oferece uma nova isoforma que pode ser simplesmente mais adequada do que a isoforma não editada. Nesta última hipótese, o benefício da edição é comparável ao de uma substituição de nucleotídeos. Para distinguir entre estas duas hipóteses, focalizamos os sites que são editados em pelo menos três dos quatro coleoides, pois a edição deveria ter existido nesses sites no ancestral comum das quatro espécies de acordo com o princípio da parcimônia (Fig. 2a). Estimamos então a frequência de substituição da edição por uma substituição A-to-G em qualquer uma das quatro espécies. Espera-se que tais substituições sejam mais ou menos neutras para a edição sinônima. Para edições não-sinônimas, tais substituições são deletérias sob a primeira hipótese devido à perda de diversidade de proteínas, mas são neutras sob a segunda hipótese. Assim, a primeira hipótese prevê uma frequência menor de tais substitutos para edição não-sinônima do que para edição sinônima, enquanto a segunda hipótese prevê frequências iguais de tais substitutos para edição sinônima e não-sinônima.
Interessantemente, a frequência de tais substitutos para edição não-sinônima é significativamente maior do que aquela para edição sinônima em um teste exato de Fisher bicaudal (Fig. 4c e Tabela Suplementar 4). Como é a edição diversificativa compartilhada para a qual a natureza do benefício está em questão, restringimos a análise apenas à edição diversificativa, mas obtivemos um resultado semelhante (Fig. 4c e Tabela Suplementar 4). Vale ressaltar que não foi encontrada nenhuma edição sinônima ou não-sinônima a ser substituída por uma substituição A-to-C/T entre esse conjunto de sites (Tabela Suplementar 4). Nossa descoberta sugere que, se alguma coisa, a edição não-sinônima é mais provável de ser substituída por uma substituição A-to-G do que a edição sinônima, provavelmente porque ter um G genômico é superior a ter um A genômico que não pode ser editado para G em todas as moléculas de mRNA. Em outras palavras, nossos resultados rejeitam a primeira hipótese e sugerem que a natureza do benefício da edição A-to-G adaptativa é semelhante à da mesma substituição de nucleotídeos, embora o tamanho do benefício da primeira seja menor do que o da segunda. Além disso, a descoberta na Fig. 4c sugere que o FD significativamente maior que o FS para edição compartilhado entre os quatro coleotideos é melhor explicado pela seleção positiva promovendo a fixação inicial de mutações que levaram à edição não-sinônima benéfica do que a seleção purificadora impedindo a perda da edição não-sinônima benéfica.