Una hipótesis no adaptativa y sus predicciones
Consideremos una posición genómica en una región codificante que actualmente está ocupada por G y no acepta A (ver fila superior en la Fig. 1a). A medida que aumenta la actividad de edición en la especie, una mutación de G a A en el sitio puede volverse neutral y fija si la A resultante se edita de nuevo a G en una proporción suficientemente grande de moléculas de ARNm (véase la fila central en la Fig. 1a). Tras la sustitución de G a A, el alto nivel de edición en el sitio se mantendrá selectivamente, porque es G en lugar de A lo que está permitido a nivel de ARNm. Como la situación anterior se aplica sólo a las sustituciones no sinónimas de G a A y a la edición acoplada no sinónima de A a G, infla el número de sitios de edición no sinónima y los niveles de edición no sinónima en relación con los valores sinónimos correspondientes. Aunque en este caso la edición no sinónima ha permitido la fijación de la mutación deletérea de G a A, el genotipo derivado con una A genómica altamente editada no es más apto que el genotipo original con una G genómica. En el escenario anterior asumimos que el nivel de edición es tan alto que la mutación G-a-A, que de otro modo sería deletérea, se vuelve neutral. También es posible que el nivel de edición no sea lo suficientemente alto, haciendo que la mutación G-a-A sea ligeramente deletérea (véase la fila inferior de la Fig. 1a). No obstante, una mutación ligeramente deletérea puede fijarse y el nivel de edición puede aumentar selectivamente en la evolución posterior. Incluso bajo este escenario, no hay una ganancia neta de fitness desde el genotipo original con una G genómica al genotipo derivado con una A genómica que está altamente editada. Nos referimos al modelo no adaptativo anterior, que incluye los dos escenarios descritos, como el modelo que permite el daño, porque la edición del ARN permite la fijación de mutaciones que de otro modo serían perjudiciales. Aunque la posibilidad de permitir el daño mediante la edición de ARN se ha propuesto en múltiples ocasiones31,38,39,40, especialmente en lo que respecta a la edición de los transcriptomas de los orgánulos, se carece de pruebas empíricas de que sea total o principalmente responsable de la creación de «señales adaptativas» de edición de ARN.
Dada la excepcionalmente alta actividad de edición en los tejidos neurales coleoides25,27, nuestra hipótesis es que la preponderancia reportada de la edición no sinónima se explica por el modelo de permiso de daño y no es adaptativa. Para probar esta hipótesis, dividimos la edición no sinónima en dos categorías: restauradora y diversificadora41. La edición restaurativa convierte el estado de los aminoácidos en un estado ancestral (Fig. 1b), mientras que la edición diversificadora convierte el estado de los aminoácidos en un estado no ancestral (Fig. 1c). Como la edición restauradora, pero no la diversificadora, puede conferir un efecto perjudicial, nuestra hipótesis predice que la preponderancia reportada de la edición no sinónima en los coleoides es atribuible a la edición restauradora pero no a la diversificadora. En particular, predecimos que (i) la frecuencia de los sitios editados es mayor para la edición restaurativa (FR) que para la sinónima (FS), y que (ii) la mediana del nivel de edición es mayor para la edición restaurativa (LR) que para la sinónima (LS). Además, predice que (iii) la frecuencia de los sitios editados no es mayor para la edición diversificadora (FD) que para la sinónima (FS), y que (iv) la mediana del nivel de edición no es mayor para la edición diversificadora (LD) que para la sinónima (LS). Por el contrario, la hipótesis adaptativa no tiene predicciones específicas sobre FR y LR, pero predice que FD y LD son respectivamente mayores que FS y LS. Cabe destacar que aunque sólo la edición restaurativa puede ser perjudicial, no toda la edición restaurativa es necesariamente perjudicial. Por ejemplo, la edición restaurativa sería neutra si restaura una sustitución neutra G-a-A.
Patrones de edición restaurativa y diversificadora
Para probar la hipótesis no adaptativa, analizamos los transcriptomas neurales publicados de seis especies de moluscos27, cuyas relaciones filogenéticas se representan en la Fig. 2a. Entre ellos, los cuatro coleoides tienen una edición generalizada de la codificación de A a G en los tejidos neurales, mientras que los dos grupos externos tienen sustancialmente menos sitios de edición27.
Identificamos 3587 genes ortólogos uno a uno en estas seis especies e inferimos secuencias de codificación ancestrales en todos los nodos interiores del árbol de especies (Fig. 2a). Consideramos que un evento de edición no sinónimo en un nodo exterior del árbol que modifica el estado de los aminoácidos de X a Y es restaurador si el estado de los aminoácidos basado en la secuencia genómica inferida es Y en cualquier nodo del árbol que sea ancestral al nodo exterior focal (Fig. 1b; también ver Métodos), o diversificador si Y no está presente en ningún nodo del árbol que sea ancestral al nodo exterior focal (Fig. 1c). Cabe destacar que estas definiciones se basan en los estados de los aminoácidos y se aplican sólo a la edición no sinónima. La edición sinónima es presumiblemente neutra, por lo que no es necesario separarla en edición restauradora y diversificadora. Además, separar la edición sinónima en las dos categorías sería menos preciso debido a la menor fiabilidad en la inferencia de secuencias ancestrales en los sitios sinónimos. De las dos categorías de sitios de edición no sinónima, el número de sitios de edición diversificadora es 8,4-13,9 veces mayor que el de sitios de edición restauradora en los cuatro coleoides (Tabla Suplementaria 1).
En cada uno de los cuatro coleoides, FR y LR son significativamente mayores que FS (Fig. 2b) y LS (Fig. 2c), respectivamente. Por el contrario, FD es significativamente menor que FS (Fig. 2b), mientras que LD no es significativamente diferente de LS (Fig. 2c). Estos resultados confirman las cuatro predicciones de la hipótesis no adaptativa y están en desacuerdo con las predicciones de la hipótesis adaptativa, sugiriendo fuertemente que la preponderancia de la edición no sinónima en los coleoides se explica por el modelo que permite el daño y es no adaptativo. La Figura 2c muestra que, aunque LR es significativamente mayor que LS en cada coleoide, es inferior al 2,5%. Cabe preguntarse si unos niveles medios tan bajos de edición restauradora pueden permitir el daño. Como se ha mencionado, no toda la edición restaurativa es necesariamente perjudicial, lo que podría explicar por qué LR no es particularmente alta. Sin embargo, la Fig. 2c revela una fracción mayor de edición restaurativa que de edición sinónima con niveles de edición apreciables. Por ejemplo, en el calamar, el 33,37% y el 13,31% de los sitios de edición restaurativa pero sólo el 22,97% y el 6,74% de los sitios de edición sinónima tienen niveles de edición >5% y >20%, respectivamente. Dependiendo del daño de la mutación de G a A y de la dominancia relativa de las isoformas A y G, estos niveles apreciables de edición de A a G podrían aumentar sustancialmente la probabilidad de fijación de la mutación de G a A. También hay que tener en cuenta que la hipótesis del daño permitido se propone como una alternativa a la hipótesis adaptativa. Si los niveles moderados de edición no sinónima pueden ser beneficiosos, como afirma la hipótesis adaptativa, no hay razón para que no puedan ser perjudiciales. Además, la tendencia general de LR > LS y LD < LS apoya la hipótesis de permitir el daño en relación con la hipótesis adaptativa.
Para examinar la solidez de nuestros resultados, llevamos a cabo cuatro análisis adicionales. En primer lugar, examinamos respectivamente los sitios de edición específicos de cada uno de los cuatro coleoides, porque los eventos de edición específicos de cada especie tienen edades evolutivas similares, lo que permite comparaciones más justas. Los resultados obtenidos son muy similares a los de la Fig. 2 y son robustos a las posibles identificaciones erróneas de la edición específica de cada especie (Fig. Suplementaria 1). En segundo lugar, probamos los eventos de edición identificados a partir de tejidos individuales en bimac. FR > FS y FD < FS se mantienen en todos los tejidos, pero las comparaciones de los niveles de edición son en su mayoría no significativas, probablemente debido a la reducida potencia estadística como resultado de la disminución del tamaño de las muestras (Tabla Suplementaria 2). En tercer lugar, debido a que los niveles de edición de los sitios de edición vecinos pueden ser co-afectados por una mutación, lo que reduciría el poder estadístico en la comparación de los sitios de edición sinónimos con los no sinónimos, comparamos los sitios de edición sinónimos en una mitad del conjunto de genes con los sitios de edición no sinónimos en la otra mitad. Específicamente, clasificamos todos los genes por la relación dN/dS entre los ortólogos de pulpo y calamar, y agrupamos respectivamente los genes con rangos impares en la casilla 1 y aquellos con rangos pares en la casilla 2. Luego comparamos la edición sinónima en la casilla 1 con la edición no sinónima en la casilla 2, así como la edición sinónima en la casilla 2 con la edición no sinónima en la casilla 1. Los resultados (Fig. Suplementaria 2) son similares a los obtenidos de todos los sitios de edición (Fig. 2). En cuarto lugar, investigamos respectivamente FR/FS y FD/FS en cinco rangos de nivel de edición (0-20%, 20-40%, 40-60%, 60-80% y 80-100%) en cada coleoide (Fig. Suplementaria 3). Tanto FR/FS como FD/FS aumentan generalmente con el nivel de edición. Aunque FR/FS casi siempre excede de 1, FD/FS es menor que 1, excepto cuando el nivel de edición supera el 60%. Es importante destacar que sólo un pequeño porcentaje de los sitios de edición diversificadora en un coleoide caen en este rango de nivel de edición (Tabla Suplementaria 3), lo que sugiere que la gran mayoría de la edición diversificadora no es adaptativa (ver más abajo las estimaciones cuantitativas).
Sustituciones G-a-A no sinónimas aceleradas
El modelo que permite el daño predice además que la tasa de sustitución G-a-A no sinónima en relación con la de sustitución G-a-A sinónima (dN/dS para G-a-A) debería ser elevada, porque la alta actividad de edición hace que algunas mutaciones G-a-A no sinónimas que de otro modo serían deletéreas sean aceptables. Además, esta elevación debería ser particularmente pronunciada en los genes que se expresan exclusivamente en los tejidos neurales, pero no en los genes que no se expresan en los tejidos neurales, porque la alta actividad de edición se observa hasta ahora sólo en los tejidos neurales25,27. Sin embargo, debido a que sólo el bimac y el calamar disponen de datos de secuenciación de ARN de varios tejidos no neuronales y a que los genes no expresados en tejidos neuronales no están en los datos de secuencias de transcripción del pulpo y la sepia, y por lo tanto están excluidos de nuestros alineamientos, tuvimos que definir dos grupos de genes con especificidades relativamente altas y relativamente bajas en la expresión neuronal, respectivamente. Los genes con altas especificidades de expresión neural se expresan exclusivamente en tejidos neurales en el bimac o en el calamar, mientras que aquellos con bajas especificidades de expresión neural se expresan tanto en tejidos neurales como no neurales tanto en el bimac como en el calamar. El modelo de permiso de daño predice que dN/dS para G-to-A es mayor para los genes con especificidades de expresión neural relativamente altas que para los de especificidades de expresión neural relativamente bajas. Como el efecto de permiso de daño está presente sólo cuando una mutación de G a A en un sitio es deletérea sin edición, nos centramos en los sitios no sinónimos que se conservan en las dos especies fuera de grupo (es decir, el nautilus, la liebre de mar y el nodo inmediatamente ancestral de las especies focales comparten el mismo estado previo a la edición) para aumentar la sensibilidad de nuestra prueba. Además, la elevación de dN/dS debería ser específica para los cambios de G a A, porque los daños potenciales de otros cambios como C/T a A y G a C/T no pueden ser aliviados por la edición de A a G.
Con este fin, consideramos las seis ramas descendientes del ancestro común de los cuatro coleoides. Calculamos dN y dS de cada una de estas ramas utilizando las secuencias ancestrales existentes e inferidas, y luego calculamos dN/dS dividiendo el total de dN por el total de dS de estas ramas. En apoyo de nuestra predicción, dN/dS para los cambios de G a A es mayor para los genes de especificidades de expresión neural relativamente altas que para los de especificidades relativamente bajas (Fig. 3). Mediante el bootstrapping de los dos grupos de genes 200 veces respectivamente, encontramos que la diferencia anterior es estadísticamente significativa (P = 0,015). Por el contrario, no existe ninguna diferencia significativa en dN/dS entre los dos grupos de genes cuando se consideran los cambios C/T-a-A o los cambios G-a-C/T (Fig. 3). Cabe destacar que dN/dS < 1 en todos los casos de la Fig. 3, lo que es consistente con el modelo que permite el daño y que no implica una selección positiva.
El beneficio potencial de la edición compartida entre especies
Se ha sugerido que la edición compartida entre múltiples especies es probablemente beneficiosa, porque de lo contrario es poco probable que el estado de edición se conserve evolutivamente36. En apoyo de esta sugerencia está el hallazgo de que, incluso en los mamíferos, donde la mayor parte de la edición no sinónima parece neutral o deletérea, la frecuencia de los sitios conservados sujetos a la edición no sinónima tanto en humanos como en ratones excede significativamente la frecuencia de los sitios conservados sujetos a la edición sinónima en ambas especies36. Un fenómeno similar se ha observado en la mosca de la fruta23. En los coleoides, una fracción considerable de la edición no sinónima es compartida por al menos dos especies y los sitios altamente editados tienden a ser compartidos27. Para entender las potenciales fuerzas evolutivas que mantienen la edición de ARN en sitios específicos a través de múltiples coleoides, analizamos la edición compartida por un clado de dos o más especies.
Un evento de edición no sinónimo compartido por un clado de especies que modifica el estado de aminoácidos de X a Y se considera restaurador si el estado de aminoácidos inferido basado en la secuencia genómica es Y en cualquier nodo del árbol que sea ancestral al ancestro común más reciente del clado, o diversificador si Y no está presente en ninguno de estos nodos ancestrales. En el estudio de la edición compartida, consideramos el nivel medio de edición en el clado donde se comparte la edición. Para los sitios de edición compartidos entre el pulpo y el bimac, y los compartidos entre el calamar y la sepia, FR y FD son ambos significativamente menores que FS (Fig. 4a). Por el contrario, LR y LD son ambos significativamente mayores que LS (Fig. 4b). Para el subconjunto de los sitios de edición compartidos anteriormente que son compartidos por los cuatro coleoides, FD y LD son respectivamente significativamente mayores que FS (Fig. 4a) y LS (Fig. 4b), al igual que FR (Fig. 4a) y LR (Fig. 4b). Una FD significativamente mayor que FS para la edición compartida podría ser causada por (i) la selección positiva que promueve la fijación inicial de las mutaciones que conducen a la edición no sinónima y/o (ii) la selección purificadora que previene la pérdida de la edición no sinónima presumiblemente beneficiosa; por lo tanto, es un claro indicador de la edición no sinónima adaptativa. Un LD significativamente mayor que el LS para la edición compartida podría ser causado por (i) la selección positiva que promueve el aumento de los niveles de edición de la edición no sinónima presumiblemente beneficiosa, (ii) la selección purificadora que impide la disminución de los niveles de edición de la edición no sinónima presumiblemente beneficiosa, (iii) la selección purificadora previene preferentemente la pérdida de la edición no sinónima de alto nivel, presumiblemente porque los altos niveles de edición están asociados con mayores beneficios que los bajos niveles de edición, y/o (iv) la selección positiva promueve preferentemente la pérdida de la edición no sinónima de bajo nivel, probablemente porque una sustitución de A a G es favorecida en un sitio editado, especialmente cuando el nivel de edición es bajo. En cualquier caso, un LD significativamente mayor sobre LS también indica una edición no sinónima adaptativa. Por lo tanto, la edición no sinónima compartida por los cuatro coleoides muestra señales adaptativas fuertes y consistentes, sugiriendo que una gran fracción es adaptativa. En comparación, la edición no sinónima compartida entre el pulpo y el bimac, y la compartida entre el calamar y la sepia muestran algunos pero no todos los signos de adaptación, y las señales adaptativas son mucho más débiles, lo que sugiere que sólo una fracción más pequeña es adaptativa.
¿Cuál es el beneficio general de la edición compartida que muestra señales adaptativas? Existen dos hipótesis. En primer lugar, la edición puede ser beneficiosa debido a la diversidad proteica intraorganismo creada25,27,32,42. Es decir, la edición permite la existencia de dos isoformas proteicas por sitio editado en un organismo, lo que puede conferir una mayor aptitud, análoga a la ventaja de los heterocigotos en los sitios polimórficos. Alternativamente, la edición ofrece una nueva isoforma que puede ser simplemente más apta que la isoforma no editada. En esta última hipótesis, el beneficio de la edición es comparable al de una sustitución de nucleótidos. Para distinguir entre estas dos hipótesis, nos centramos en los sitios editados en al menos tres de los cuatro coleoides, porque la edición debería haber existido en estos sitios en el ancestro común de las cuatro especies según el principio de parsimonia (Fig. 2a). A continuación, estimamos la frecuencia de sustitución de la edición por una sustitución de A a G en cualquiera de las cuatro especies. Se espera que tales sustituciones sean más o menos neutrales para la edición sinónima. Para la edición no sinónima, tales sustituciones son deletéreas bajo la primera hipótesis debido a la pérdida de diversidad de la proteína, pero son neutrales bajo la segunda hipótesis. Por lo tanto, la primera hipótesis predice una menor frecuencia de tales reemplazos para la edición no sinónima que la edición sinónima, mientras que la segunda hipótesis predice frecuencias iguales de tales reemplazos para la edición sinónima y no sinónima.
Interesantemente, la frecuencia de tales reemplazos para la edición no sinónima es significativamente mayor que para la edición sinónima en una prueba exacta de Fisher de dos colas (Fig. 4c y Tabla Suplementaria 4). Debido a que es la edición diversificada compartida para la que la naturaleza del beneficio está en cuestión, restringimos el análisis a la edición diversificada solamente, pero obtuvimos un resultado similar (Fig. 4c y Tabla Suplementaria 4). Cabe destacar que no se encontró ninguna edición sinónima o no sinónima que fuera reemplazada por una sustitución de A a C/T entre este conjunto de sitios (Tabla Suplementaria 4). Nuestro hallazgo sugiere que, en todo caso, la edición no sinónima es más probable que sea reemplazada por una sustitución de A a G que la edición sinónima, probablemente porque tener una G genómica es superior a tener una A genómica que no puede ser editada a G en todas las moléculas de ARNm. En otras palabras, nuestros resultados rechazan la primera hipótesis y sugieren que la naturaleza del beneficio de la edición adaptativa de A a G es similar a la de la misma sustitución de nucleótidos, aunque el tamaño del beneficio de la primera es menor que el de la segunda. Además, el hallazgo de la Fig. 4c sugiere que la significativamente mayor FD que FS para la edición compartida entre los cuatro coleoides se explica mejor por la selección positiva que promueve la fijación inicial de las mutaciones que condujeron a la edición no sinónima beneficiosa que la selección purificadora que previene la pérdida de la edición no sinónima beneficiosa.