Une hypothèse non adaptative et ses prédictions
Sidérons une position génomique dans une région codante qui est actuellement occupée par G et n’accepte pas A (voir la ligne supérieure de la figure 1a). Au fur et à mesure que l’activité d’édition augmente dans l’espèce, une mutation G vers A sur ce site peut devenir neutre et fixe si le A résultant est réédité en G dans une proportion suffisamment importante de molécules d’ARNm (voir la ligne du milieu sur la figure 1a). Lors de la substitution de G en A, le niveau d’édition élevé sur le site sera maintenu sélectivement, car c’est G plutôt que A qui est autorisé au niveau de l’ARNm. Comme la situation ci-dessus ne s’applique qu’aux substitutions non synonymes de G en A et à l’édition non synonyme couplée de A en G, elle gonfle le nombre de sites d’édition non synonymes et les niveaux d’édition non synonymes par rapport aux valeurs synonymes correspondantes. Bien qu’ici l’édition non synonyme ait permis la fixation de la mutation G vers A, autrement délétère, le génotype dérivé avec un A génomique fortement édité n’est pas plus adapté que le génotype original avec un G génomique. Nous avons supposé dans le scénario ci-dessus que le niveau d’édition est si élevé que la mutation G vers A, par ailleurs délétère, devient neutre. Il est également possible que le niveau d’édition ne soit pas assez élevé, rendant la mutation G vers A légèrement délétère (voir la ligne inférieure de la figure 1a). Une mutation légèrement délétère peut néanmoins être fixée et le niveau d’édition peut être sélectivement augmenté au cours de l’évolution ultérieure. Même dans ce scénario, il n’y a pas de gain net de fitness entre le génotype original avec un G génomique et le génotype dérivé avec un A génomique fortement modifié. Nous appelons le modèle non adaptatif ci-dessus, qui inclut les deux scénarios décrits, le modèle d’autorisation des dommages, car l’édition de l’ARN permet la fixation de mutations autrement nuisibles. Bien que la possibilité d’un harm-permitting par l’édition de l’ARN ait été proposée à de multiples reprises31,38,39,40, notamment en ce qui concerne l’édition des transcriptomes des organites, les preuves empiriques qu’elle est entièrement ou principalement responsable de la création de « signaux adaptatifs » de l’édition de l’ARN font défaut.
Compte tenu de l’activité d’édition exceptionnellement élevée dans les tissus neuronaux coléoïdes25,27, nous émettons l’hypothèse que la prépondérance signalée de l’édition non synonyme s’explique par le modèle d’autorisation des dommages et est non adaptative. Pour tester cette hypothèse, nous divisons l’édition non synonyme en deux catégories : restauratrice et diversifiante41. L’édition restauratrice ramène l’état de l’acide aminé à un état ancestral (Fig. 1b), tandis que l’édition diversifiante convertit l’état de l’acide aminé à un état non ancestral (Fig. 1c). Comme l’édition restauratrice, mais pas l’édition diversifiante, peut conférer un effet de tolérance, notre hypothèse prédit que la prépondérance rapportée de l’édition non synonyme dans les coléoïdes est attribuable à l’édition restauratrice mais pas à l’édition diversifiante. En particulier, nous prédisons que (i) la fréquence des sites édités est plus grande pour l’édition restauratrice (FR) que pour l’édition synonyme (FS), et que (ii) le niveau d’édition médian est plus élevé pour l’édition restauratrice (LR) que pour l’édition synonyme (LS). Elle prédit également que (iii) la fréquence des sites édités n’est pas plus élevée pour l’édition diversifiée (FD) que pour l’édition synonyme (FS), et que (iv) le niveau d’édition médian n’est pas plus élevé pour l’édition diversifiée (LD) que pour l’édition synonyme (LS). En revanche, l’hypothèse adaptative n’a pas de prédictions spécifiques concernant FR et LR, mais prédit que FD et LD sont respectivement plus importantes que FS et LS. Il convient de noter que, même si seule l’édition réparatrice peut permettre de causer des dommages, toutes les éditions réparatrices ne le font pas nécessairement. Par exemple, l’édition restauratrice serait neutre si elle restaure une substitution G vers A neutre.
Patrons d’édition restauratrice et diversifiante
Pour tester l’hypothèse non adaptative, nous avons analysé les transcriptomes neuraux publiés de six espèces de mollusques27, dont les relations phylogénétiques sont représentées dans la figure 2a. Parmi elles, les quatre coléoïdes présentent une édition codante A-à-G généralisée dans les tissus neuraux, tandis que les deux groupes extérieurs présentent nettement moins de sites d’édition27.
Nous avons identifié 3587 gènes orthologues un-à-un dans ces six espèces et inféré des séquences codantes ancestrales à tous les nœuds intérieurs de l’arbre des espèces (Fig. 2a). Nous avons considéré qu’un événement d’édition non synonyme dans un nœud extérieur de l’arbre qui modifie l’état de l’acide aminé de X à Y était réparateur si l’état de l’acide aminé basé sur la séquence génomique déduite est Y à n’importe quel nœud de l’arbre qui est ancestral au nœud extérieur focal (Fig. 1b ; voir également Méthodes), ou diversifiant si Y n’est présent à aucun nœud de l’arbre qui est ancestral au nœud extérieur focal (Fig. 1c). Il convient de noter que ces définitions sont basées sur les états des acides aminés et ne s’appliquent qu’à l’édition non synonyme. L’édition synonyme est vraisemblablement neutre et il n’est donc pas nécessaire de la séparer en édition restauratrice et diversifiante. En outre, la séparation de l’édition synonyme en deux catégories serait moins précise en raison de la fiabilité moindre de l’inférence des séquences ancestrales aux sites synonymes. Parmi les deux catégories de sites d’édition non synonymes, le nombre de sites d’édition diversifiants est 8,4-13,9 fois supérieur à celui des sites d’édition restaurateurs dans les quatre coléoïdes (tableau supplémentaire 1).
Dans chacun des quatre coléoïdes, FR et LR sont significativement plus grands que FS (Fig. 2b) et LS (Fig. 2c), respectivement. En revanche, FD est significativement plus petit que FS (Fig. 2b), tandis que LD n’est pas significativement différent de LS (Fig. 2c). Ces résultats confirment les quatre prédictions de l’hypothèse non adaptative et sont en désaccord avec les prédictions de l’hypothèse adaptative, ce qui suggère fortement que la prépondérance de l’édition non synonyme dans les coléoïdes est expliquée par le modèle de tolérance aux dommages et est non adaptative. La figure 2c montre que, bien que LR soit significativement plus élevé que LS dans chaque coléoïde, il est inférieur à 2,5%. On peut se demander si des niveaux médians d’édition réparatrice aussi bas peuvent être tolérés. Comme nous l’avons mentionné, toutes les modifications réparatrices ne sont pas nécessairement tolérantes, ce qui pourrait expliquer pourquoi LR n’est pas particulièrement élevé. Néanmoins, la figure 2c révèle une fraction plus importante d’édition réparatrice que d’édition synonyme avec des niveaux d’édition appréciables. Par exemple, chez le calmar, 33,37% et 13,31% des sites d’édition réparatrice mais seulement 22,97% et 6,74% des sites d’édition synonyme ont des niveaux d’édition >5% et >20%, respectivement. En fonction de la nocivité de la mutation G vers A et de la dominance relative des isoformes A et G, ces niveaux appréciables d’édition A vers G pourraient augmenter substantiellement la probabilité de fixation de la mutation G vers A. Il convient également de noter que l’hypothèse de l’autorisation des dommages est proposée comme une alternative à l’hypothèse adaptative. Si des niveaux modérés d’édition non synonyme peuvent être bénéfiques comme l’affirme l’hypothèse adaptative, il n’y a aucune raison pour qu’ils ne puissent pas être nuisibles. En outre, la tendance générale de LR > LS et LD < LS soutient l’hypothèse de l’autorisation des dommages par rapport à l’hypothèse adaptative.
Pour examiner la robustesse de nos résultats, nous avons effectué quatre analyses supplémentaires. Tout d’abord, nous avons respectivement examiné les sites d’édition spécifiques à chacun des quatre coléoïdes, car les événements d’édition spécifiques aux espèces ont des âges évolutifs similaires, permettant des comparaisons plus justes. Les résultats obtenus sont très similaires à ceux de la figure 2 et sont robustes aux erreurs potentielles d’identification de l’édition spécifique à une espèce (figure supplémentaire 1). Deuxièmement, nous avons sondé les événements d’édition identifiés à partir de tissus individuels chez le bimac. FR > FS et FD < FS se maintiennent dans tous les tissus, mais les comparaisons des niveaux d’édition sont pour la plupart non significatives, probablement en raison de la puissance statistique réduite résultant de la diminution de la taille des échantillons (tableau supplémentaire 2). Troisièmement, comme les niveaux d’édition de sites d’édition voisins peuvent être co-affectés par une mutation, ce qui réduirait la puissance statistique de la comparaison des sites d’édition synonymes et non synonymes, nous avons comparé les sites d’édition synonymes dans une moitié de l’ensemble des gènes avec les sites d’édition non synonymes dans l’autre moitié. Plus précisément, nous avons classé tous les gènes en fonction du rapport dN/dS entre les orthologues de pieuvre et de calmar, et avons respectivement regroupé les gènes de rang impair dans la case 1 et ceux de rang pair dans la case 2. Nous avons ensuite comparé l’édition synonyme dans la case 1 avec l’édition non synonyme dans la case 2, ainsi que l’édition synonyme dans la case 2 avec l’édition non synonyme dans la case 1. Les résultats (Fig. 2 supplémentaire) sont similaires à ceux obtenus pour tous les sites d’édition (Fig. 2). Quatrièmement, nous avons étudié respectivement FR/FS et FD/FS dans cinq plages de niveaux d’édition (0-20%, 20-40%, 40-60%, 60-80% et 80-100%) dans chaque coléoïde (Fig. 3 supplémentaire). FR/FS et FD/FS augmentent généralement avec le niveau d’édition. Bien que FR/FS dépasse presque toujours 1, FD/FS est inférieur à 1, sauf lorsque le niveau d’édition dépasse 60 %. Il est important de souligner que seuls quelques pour cent des sites d’édition diversifiante dans un coléoïde se situent dans cette gamme de niveaux d’édition (tableau supplémentaire 3), ce qui suggère que la grande majorité de l’édition diversifiante est non adaptative (voir ci-dessous pour les estimations quantitatives).
Accélération des substitutions G-à-A non synonymes
Le modèle d’autorisation des dommages prédit en outre que le taux de substitution G-à-A non synonyme par rapport à celui de la substitution G-à-A synonyme (dN/dS pour G-à-A) devrait être élevé, car l’activité d’édition élevée rend acceptables certaines mutations G-à-A non synonymes autrement délétères. De plus, cette élévation devrait être particulièrement prononcée dans les gènes exprimés exclusivement dans les tissus neuraux, mais pas dans les gènes non exprimés dans les tissus neuraux, car la forte activité d’édition n’est jusqu’à présent observée que dans les tissus neuraux25,27. Cependant, étant donné que seuls le bimac et le calmar disposent de données de séquençage d’ARN provenant de plusieurs tissus non neuraux et que les gènes non exprimés dans les tissus neuraux ne figurent pas dans les données de séquence de transcription du poulpe et de la seiche, et sont donc exclus de nos alignements, nous avons dû définir deux groupes de gènes présentant des spécificités relativement élevées et relativement faibles en matière d’expression neuronale, respectivement. Les gènes à haute spécificité d’expression neurale sont exprimés exclusivement dans les tissus neuraux chez le bimac ou le calmar, tandis que ceux à faible spécificité d’expression neurale sont exprimés à la fois dans les tissus neuraux et non neuraux chez le bimac et le calmar. Le modèle d’autorisation des dommages prédit que dN/dS pour G-to-A est plus grand pour les gènes avec des spécificités d’expression neuronale relativement élevées que pour ceux avec des spécificités d’expression neutre relativement faibles. Étant donné que l’effet d’autorisation des dommages n’est présent que lorsqu’une mutation G vers A sur un site est délétère sans édition, nous nous sommes concentrés sur les sites non synonymes qui sont conservés dans les deux espèces de l’outgroupe (c’est-à-dire que le nautile, le lièvre de mer et le nœud immédiatement ancestral de l’espèce focale partagent le même état avant édition) afin d’augmenter la sensibilité de notre test. En outre, l’élévation de dN/dS devrait être spécifique aux changements G vers A, car les préjudices potentiels d’autres changements tels que C/T vers A et G vers C/T ne peuvent pas être atténués par l’édition A vers G.
À cette fin, nous avons considéré les six branches qui descendent de l’ancêtre commun des quatre coléoïdes. Nous avons calculé dN et dS de chacune de ces branches en utilisant les séquences ancestrales existantes et inférées, puis nous avons calculé dN/dS en divisant le total dN par le total dS de ces branches. A l’appui de notre prédiction, le dN/dS pour les changements G vers A est plus grand pour les gènes de spécificités d’expression neuronale relativement élevées que pour ceux de spécificités relativement faibles (Fig. 3). En bootstrappant respectivement 200 fois les deux groupes de gènes, nous avons constaté que la différence ci-dessus est statistiquement significative (P = 0,015). En revanche, il n’existe aucune différence significative dans les dN/dS entre les deux groupes de gènes lorsque les changements C/T vers A ou G vers C/T sont pris en compte (Fig. 3). Il convient de noter que dN/dS < 1 dans tous les cas de la figure 3, ce qui est cohérent avec le modèle d’autorisation des dommages qui n’implique pas de sélection positive.
L’avantage potentiel de l’édition partagée entre les espèces
Il a été suggéré que l’édition partagée entre plusieurs espèces est probablement bénéfique, car sinon l’état d’édition est peu susceptible d’être conservé au cours de l’évolution36. À l’appui de cette suggestion, on a constaté que, même chez les mammifères, où la plupart des modifications non synonymes semblent neutres ou délétères, la fréquence des sites conservés soumis à des modifications non synonymes chez l’homme et la souris dépasse considérablement la fréquence des sites conservés soumis à des modifications synonymes chez ces deux espèces36. Un phénomène similaire a été signalé chez la mouche à fruits23. Chez les coléoïdes, une fraction importante de l’édition non synonyme est partagée par au moins deux espèces et les sites hautement édités ont tendance à être partagés27. Pour comprendre les forces évolutives potentielles qui maintiennent l’édition de l’ARN sur des sites spécifiques dans plusieurs coléoïdes, nous avons analysé l’édition partagée par un clade de deux espèces ou plus.
Un événement d’édition non synonyme partagé par un clade d’espèces qui modifie l’état de l’acide aminé de X à Y est considéré comme restaurateur si l’état de l’acide aminé basé sur la séquence génomique déduite est Y à n’importe quel nœud de l’arbre qui est ancestral à l’ancêtre commun le plus récent du clade, ou diversifiant si Y n’est présent à aucun de ces nœuds ancestraux. Dans l’étude de l’édition partagée, nous avons considéré le niveau d’édition moyen dans le clade où l’édition est partagée. Pour les sites d’édition partagés entre la pieuvre et le bimac, et ceux partagés entre le calmar et la seiche, FR et FD sont tous deux significativement plus petits que FS (Fig. 4a). En revanche, LR et LD sont tous deux significativement supérieurs à LS (Fig. 4b). Pour le sous-ensemble des sites d’édition partagés ci-dessus qui sont partagés par les quatre coléoïdes, FD et LD sont respectivement significativement plus grands que FS (Fig. 4a) et LS (Fig. 4b), tout comme FR (Fig. 4a) et LR (Fig. 4b). Une FD significativement plus grande que FS pour l’édition partagée pourrait être causée par (i) une sélection positive favorisant la fixation initiale des mutations qui conduisent à l’édition non synonyme et/ou (ii) une sélection purificatrice empêchant la perte de l’édition non synonyme présumée bénéfique ; par conséquent, c’est un indicateur clair de l’édition non synonyme adaptative. Un DL significativement plus grand que le LS pour l’édition partagée pourrait être causé par (i) une sélection positive favorisant l’augmentation des niveaux d’édition de l’édition non synonyme présumée bénéfique, (ii) une sélection purificatrice empêchant la diminution des niveaux d’édition de l’édition non synonyme présumée bénéfique, (iii) une sélection purificatrice empêchant préférentiellement la perte de l’édition non synonyme de haut niveau, probablement parce que les niveaux d’édition élevés sont associés à des avantages plus importants que les niveaux d’édition faibles, et/ou (iv) une sélection positive favorisant préférentiellement la perte de l’édition non synonyme de bas niveau, probablement parce qu’une substitution A vers G est favorisée sur un site édité, en particulier lorsque le niveau d’édition est faible. Quoi qu’il en soit, un DL significativement plus élevé que le LS indique également une édition non synonyme adaptative. Ainsi, l’édition non synonyme partagée par les quatre coléoïdes présente des signaux adaptatifs forts et cohérents, ce qui suggère qu’une grande partie est adaptative. En comparaison, l’édition non synonyme partagée entre le poulpe et le bimac, et celle partagée entre le calmar et la seiche présentent certains signes d’adaptation mais pas tous, et les signaux adaptatifs sont beaucoup plus faibles, ce qui suggère que seule une fraction plus petite est adaptative.
Quel est l’avantage général de l’édition partagée qui présente des signaux adaptatifs ? Deux hypothèses existent. Premièrement, l’édition peut être bénéfique en raison de la diversité protéique intra-organisme créée25,27,32,42. En d’autres termes, l’édition permet l’existence de deux isoformes de protéines par site édité dans un organisme, ce qui peut conférer une meilleure aptitude, de manière analogue à l’avantage de l’hétérozygote sur les sites polymorphes. Ou bien, l’édition offre une nouvelle isoforme qui peut être simplement plus adaptée que l’isoforme non éditée. Dans cette dernière hypothèse, l’avantage de l’édition est comparable à celui d’une substitution nucléotidique. Pour distinguer ces deux hypothèses, nous nous sommes concentrés sur les sites qui sont édités dans au moins trois des quatre coléoïdes, car l’édition devrait avoir existé à ces sites dans l’ancêtre commun des quatre espèces selon le principe de parcimonie (Fig. 2a). Nous avons ensuite estimé la fréquence de remplacement de l’édition par une substitution de A en G dans l’une des quatre espèces. On s’attend à ce que de tels remplacements soient plus ou moins neutres pour l’édition synonyme. Pour l’édition non synonyme, de tels remplacements sont délétères selon la première hypothèse en raison de la perte de diversité protéique mais sont neutres selon la seconde hypothèse. Par conséquent, la première hypothèse prédit une fréquence plus faible de tels remplacements pour l’édition non synonyme que pour l’édition synonyme, alors que la seconde hypothèse prédit des fréquences égales de tels remplacements pour l’édition synonyme et non synonyme.
Il est intéressant de noter que la fréquence de tels remplacements pour l’édition non synonyme est significativement supérieure à celle de l’édition synonyme dans un test exact de Fisher à deux intervalles (figure 4c et tableau supplémentaire 4). Étant donné que c’est l’édition diversifiée partagée pour laquelle la nature de l’avantage est en question, nous avons restreint l’analyse à l’édition diversifiée uniquement, mais nous avons obtenu un résultat similaire (figure 4c et tableau supplémentaire 4). Il convient de noter qu’aucune édition synonyme ou non synonyme n’a été remplacée par une substitution A-C/T dans cet ensemble de sites (tableau supplémentaire 4). Nos résultats suggèrent que, le cas échéant, l’édition non synonyme est plus susceptible d’être remplacée par une substitution de A en G que l’édition synonyme, probablement parce que la présence d’un G génomique est supérieure à celle d’un A génomique qui ne peut pas être modifié en G dans toutes les molécules d’ARNm. En d’autres termes, nos résultats rejettent la première hypothèse et suggèrent que la nature de l’avantage de l’édition adaptative de A en G est similaire à celle de la même substitution nucléotidique, bien que la taille de l’avantage de la première soit plus petite que celle de la seconde. En outre, les résultats de la figure 4c suggèrent que la FD significativement plus grande que la FS pour l’édition partagée entre les quatre coléoïdes s’explique mieux par une sélection positive favorisant la fixation initiale des mutations qui ont conduit à une édition non synonyme bénéfique que par une sélection purificatrice empêchant la perte de l’édition non synonyme bénéfique.