En ikke-adaptiv hypotese og dens forudsigelser
Lad os overveje en genomisk position i en kodningsregion, der i øjeblikket er besat af G og ikke accepterer A (se øverste række i Fig. 1a). Efterhånden som editeringsaktiviteten i arten stiger, kan en G-til-A-mutation på dette sted blive neutral og fastlåst, hvis det resulterende A redigeres tilbage til G i en tilstrækkelig stor andel af mRNA-molekylerne (se den midterste række i fig. 1a). Ved G-til-A-substitutionen vil det høje redigeringsniveau på stedet blive opretholdt selektivt, fordi det er G snarere end A, der er tilladt på mRNA-niveau. Da ovenstående situation kun gælder for nonsynonyme G-til-A-substitutioner og den koblede nonsynonyme A-til-G-redigering, opblæser den antallet af nonsynonyme redigeringssteder og nonsynonyme redigeringsniveauer i forhold til de tilsvarende synonyme værdier. Selv om den nonsynonyme redigering her har gjort det muligt at fikserer den ellers skadelige G-til-A-mutation, er den afledte genotype med et genomisk A, der er stærkt redigeret, ikke bedre egnet end den oprindelige genotype med et genomisk G. Redigeringen er således ikke-adaptiv. I ovenstående scenario antog vi, at redigeringsniveauet er så højt, at den ellers skadelige G-til-A-mutation bliver neutral. Det er også muligt, at redigeringsniveauet ikke er højt nok, hvilket gør G-til-A-mutationen lidt skadelig (se nederste række i fig. 1a). En let skadelig mutation kan ikke desto mindre blive fikseret, og redigeringsniveauet kan blive selektivt forhøjet i den efterfølgende evolution. Selv under dette scenarie er der ikke nogen nettofitnessgevinst fra den oprindelige genotype med et genomisk G til den afledte genotype med et genomisk A, der er stærkt redigeret. Vi kalder den ovenstående ikke-adaptive model, der omfatter begge de beskrevne scenarier, for “harm-permitting-modellen”, fordi RNA-redigering gør det muligt at fikserer ellers skadelige mutationer. Selv om muligheden for, at RNA-redigering kan tillade skade, er blevet foreslået flere gange31,38,39,40, især med hensyn til redigering af organelle transkriptomer, mangler der empiriske beviser for, at det udelukkende eller primært er ansvarlig for at skabe “adaptive signaler” af RNA-redigering.
I betragtning af den usædvanligt høje redigeringsaktivitet i coleoide neurale væv25,27 opstiller vi den hypotese, at den rapporterede overvægt af nonsynonym redigering forklares af harm-permitting-modellen og er ikke-adaptiv. For at teste denne hypotese opdeler vi nonsynonym redigering i to kategorier: genoprettende og diversificerende41. Restaurativ redigering konverterer aminosyretilstanden tilbage til en forfødt tilstand (fig. 1b), mens diversificerende redigering konverterer aminosyretilstanden til en ikke-forfødt tilstand (fig. 1c). Da genoprettende redigering, men ikke diversificerende redigering kan give en skadelig effekt, forudsiger vores hypotese, at den rapporterede overvægt af nonsynonym redigering i coleoider kan tilskrives genoprettende, men ikke diversificerende redigering. Vi forudsiger især, at (i) frekvensen af steder, der redigeres, er større for restorativ (FR) end synonym (FS) redigering, og at (ii) medianredigeringsniveauet er højere for restorativ (LR) end synonym (LS) redigering. Den forudsiger endvidere, at (iii) frekvensen af redigerede steder ikke er større for diversificerende (FD) end for synonym (FS) redigering, og at (iv) det mediane redigeringsniveau ikke er højere for diversificerende (LD) end for synonym (LS) redigering. I modsætning hertil har den adaptive hypotese ikke specifikke forudsigelser om FR og LR, men forudsiger, at FD og LD er henholdsvis større end FS og LS. Det er bemærkelsesværdigt, at selv om kun genoprettende redigering kan være skadesbefordrende, er ikke al genoprettende redigering nødvendigvis skadesbefordrende. For eksempel ville den genoprettende redigering være neutral, hvis den genopretter en neutral G-til-A substitution.
Mønstre for genoprettende og diversificerende redigering
For at teste den ikke-adaptive hypotese analyserede vi de offentliggjorte neurale transkriptomer af seks bløddyrarter27, hvis fylogenetiske relationer er afbildet i Fig. 2a. Blandt dem har de fire coleoider udbredt kodning af A til G-redigering i neurale væv, mens de to ydergrupper har væsentligt færre redigeringssteder27.
Vi identificerede 3587 ortologt én-til-én gener i disse seks arter og udledte forfædres kodningssekvenser ved alle indre knuder i artstræet (Fig. 2a). Vi betragtede en nonsynonym redigeringsbegivenhed i en ydre knude af træet, der ændrer aminosyretilstanden fra X til Y som genoprettende, hvis den udledte genomiske sekvensbaserede aminosyretilstand er Y på enhver knude af træet, der er forfødt til den fokale ydre knude (Fig. 1b; se også Metoder), eller diversificerende, hvis Y ikke er til stede på enhver knude af træet, der er forfødt til den fokale ydre knude (Fig. 1c). Det er værd at bemærke, at disse definitioner er baseret på aminosyretilstande og kun anvendes på nonsynonym redigering. Synonym redigering er formodentlig neutral og behøver derfor ikke at blive opdelt i genoprettende og diversificerende redigering. Desuden ville en opdeling af synonym redigering i de to kategorier være mindre nøjagtig på grund af lavere pålidelighed ved udledning af forfædres sekvenser på synonyme steder. Af de to kategorier af nonsynonyme redigeringssteder er antallet af diversificerende redigeringssteder 8,4-13,9 gange så stort som antallet af restorative redigeringssteder i de fire coleoider (Supplerende tabel 1).
I hver af de fire coleoider er FR og LR signifikant større end henholdsvis FS (Fig. 2b) og LS (Fig. 2c). Derimod er FD signifikant mindre end FS (fig. 2b), mens LD ikke er signifikant forskellig fra LS (fig. 2c). Disse resultater bekræfter alle fire forudsigelser af den ikke-adaptive hypotese og er i modstrid med forudsigelserne af den adaptive hypotese, hvilket stærkt tyder på, at overvægten af nonsynonym redigering i coleoider forklares af den skadetilladende model og er ikke-adaptiv. Figur 2c viser, at selv om LR er signifikant højere end LS i hver coleoid, er den lavere end 2,5 %. Man kan spørge, om et så lavt medianniveau af genoprettende redigering kan være skadelignende. Som nævnt er ikke al genoprettende redigering nødvendigvis skadegodkendt, hvilket kunne forklare, hvorfor LR ikke er særlig høj. Ikke desto mindre viser fig. 2c, at der er en større andel af genoprettende redigering end synonym redigering med betydelige redigeringsniveauer. For eksempel har 33,37 % og 13,31 % af de restorative redigeringssteder i blæksprutten 33,37 % og 13,31 % af de restorative redigeringssteder, men kun 22,97 % og 6,74 % af de synonyme redigeringssteder har redigeringsniveauer på henholdsvis >5 % og >20 %. Afhængigt af G-til-A-mutationens skadevirkninger og den relative dominans af A- og G-isoformerne kan disse betydelige niveauer af A-til-G-redigering øge G-til-A-mutationens fikseringssandsynlighed betydeligt. Det skal også bemærkes, at den skadelige hypotese er foreslået som et alternativ til den adaptive hypotese. Hvis moderate niveauer af nonsynonym redigering kan være gavnlige, som det hævdes i den adaptive hypotese, er der ingen grund til, at de ikke kan være skadelige. Desuden understøtter den generelle tendens for LR > LS og LD < LS den skadelige hypotese i forhold til den adaptive hypotese.
For at undersøge robustheden af vores resultater udførte vi fire yderligere analyser. For det første undersøgte vi henholdsvis redigeringssteder, der er specifikke for hver af de fire coleoider, fordi artsspecifikke redigeringsbegivenheder har lignende evolutionære aldre, hvilket giver mulighed for mere retfærdige sammenligninger. De opnåede resultater ligner i høj grad resultaterne i fig. 2 og er robuste over for potentielle fejlidentifikationer af artsspecifik redigering (Supplerende fig. 1). For det andet undersøgte vi redigeringsbegivenheder, der blev identificeret fra individuelle væv i bimac. FR > FS og FD < FS holder på tværs af væv, men sammenligninger af redigeringsniveauet er for det meste ikke-signifikante, sandsynligvis på grund af den reducerede statistiske styrke som følge af de reducerede prøvestørrelser (Supplerende tabel 2). For det tredje, fordi redigeringsniveauer af nærliggende redigeringssteder kan være co-affekteret af en mutation, hvilket ville reducere den statistiske styrke ved sammenligning af synonyme med nonsynonyme redigeringssteder, sammenlignede vi synonyme redigeringssteder i den ene halvdel af gensættet med nonsynonyme redigeringssteder i den anden halvdel. Specifikt rangordnede vi alle gener efter dN/dS-forholdet mellem ortologer fra blæksprutte og blæksprutte og grupperede henholdsvis gener med ulige rang i bin 1 og gener med lige rang i bin 2. Vi sammenlignede derefter synonym redigering i bin 1 med nonsynonym redigering i bin 2, samt synonym redigering i bin 2 med nonsynonym redigering i bin 1. Resultaterne (Supplerende fig. 2) svarer til dem, der er opnået fra alle redigeringssteder (fig. 2). For det fjerde undersøgte vi henholdsvis FR/FS og FD/FS i fem redigeringsniveauintervaller (0-20 %, 20-40 %, 40-60 %, 60-80 % og 80-100 %) i hver coleoid (Supplerende fig. 3). Både FR/FS og FD/FS stiger generelt med redigeringsniveauet. Selv om FR/FS næsten altid overstiger 1, er FD/FS mindre end 1, undtagen når redigeringsniveauet overstiger 60 %. Det er vigtigt at understrege, at kun få procent af de diversificerende redigeringssteder i en coleoid falder inden for dette redigeringsniveauinterval (Supplerende tabel 3), hvilket tyder på, at langt størstedelen af den diversificerende redigering er ikke-adaptiv (se nedenfor for kvantitative skøn).
Accelererede nonsynonyme G-til-A-substitutioner
Den skadelige model forudsiger endvidere, at hastigheden af nonsynonym G-til-A-substitution i forhold til den af synonym G-til-A-substitution (dN/dS for G-til-A) bør være forhøjet, fordi den høje redigeringsaktivitet gør nogle ellers skadelige nonsynonyme G-til-A-mutationer acceptable. Desuden bør denne forøgelse være særlig udtalt i gener, der udelukkende udtrykkes i neurale væv, men ikke i gener, der ikke udtrykkes i neurale væv, fordi den høje redigeringsaktivitet hidtil kun er observeret i neurale væv25,27. Men fordi kun bimac og blæksprutte har tilgængelige RNA-sekventeringsdata fra flere ikke-neurale væv, og fordi gener, der ikke udtrykkes i neurale væv, ikke findes i transkriptsekvensdataene for blæksprutte og blæksprutte, og derfor er udelukket fra vores alignementer, måtte vi definere to grupper af gener med henholdsvis relativt høj og relativt lav specificitet i neurale udtryk. Generne med høj neural ekspressionsspecificitet udtrykkes udelukkende i neurale væv hos bimac eller blæksprutte, mens generne med lav neural ekspressionsspecificitet udtrykkes i både neurale og ikke-nurale væv hos både bimac og blæksprutte. Den skadelige model forudsiger, at dN/dS for G-til-A er større for gener med relativt høje neurale ekspressionsspecificiteter end for gener med relativt lave neutrale ekspressionsspecificiteter. Da harm-permitting-effekten kun er til stede, når en G-til-A-mutation på et sted er skadelig uden redigering, fokuserede vi på nonsynonyme steder, der er bevaret i de to outgroup-arter (dvs. nautilus, søhare og den umiddelbart forfødte knude af den fokuserede art deler den samme tilstand før redigering) for at øge følsomheden af vores test. Endvidere bør forhøjelsen i dN/dS være specifik for G-til-A-ændringer, fordi de potentielle skader af andre ændringer såsom C/T-til-A og G-til-C/T ikke kan afhjælpes af A-til-G-redigering.
Dertil overvejede vi alle seks grene, der nedstammer fra den fælles forfader for de fire coleoider. Vi beregnede dN og dS for hver af disse grene ved hjælp af de eksisterende og de udledte forfædres sekvenser og beregnede derefter dN/dS ved at dividere det samlede dN med det samlede dS for disse grene. Til støtte for vores forudsigelse er dN/dS for G-til-A-ændringer større for gener med relativt høje neurale ekspressionsspecificiteter end for gener med relativt lave specificiteter (Fig. 3). Ved henholdsvis bootstrapping af de to grupper af gener 200 gange fandt vi, at den ovennævnte forskel er statistisk signifikant (P = 0,015). Derimod er der ingen signifikant forskel i dN/dS mellem de to grupper af gener, når der tages hensyn til C/T-til-A-ændringer eller G-til-C/T-ændringer (Fig. 3). Det er bemærkelsesværdigt, at dN/dS < 1 i alle tilfælde i Fig. 3, hvilket er i overensstemmelse med den skadestillende model, der ikke involverer positiv selektion.
Den potentielle fordel ved fælles redigering blandt arter
Det er blevet foreslået, at fælles redigering blandt flere arter sandsynligvis er gavnlig, fordi det ellers er usandsynligt, at redigeringsstatus ikke er evolutionært bevaret36. Til støtte for dette forslag blev det konstateret, at selv hos pattedyr, hvor de fleste nonsynonyme redigeringer synes neutrale eller skadelige, overstiger frekvensen af bevarede steder, der er genstand for nonsynonym redigering, hos både mennesker og mus betydeligt frekvensen af bevarede steder, der er genstand for synonym redigering, hos begge arter36. Et lignende fænomen blev rapporteret i frugtfluer23. I coleoider deles en betydelig del af den nonsynonyme redigering af mindst to arter, og der er en tendens til at dele stærkt redigerede steder27. For at forstå de potentielle evolutionære kræfter, der opretholder RNA-redigering på specifikke steder på tværs af flere coleoider, analyserede vi redigering, der deles af en klade af to eller flere arter.
En nonsynonym redigeringsbegivenhed, der deles af en klade af arter, som ændrer aminosyretilstanden fra X til Y, betragtes som genoprettende, hvis den udledte genomiske sekvensbaserede aminosyretilstand er Y på enhver knude i træet, der er forfader til kladens seneste fælles forfader, eller diversificerende, hvis Y ikke er til stede på nogen af disse forfædres knuder. I undersøgelsen af delt redigering har vi taget hensyn til det gennemsnitlige redigeringsniveau i den klade, hvor redigeringen er delt. For redigeringssteder, der deles mellem blæksprutte og bimac, og dem, der deles mellem blæksprutte og blæksprutte, er FR og FD begge betydeligt mindre end FS (fig. 4a). Derimod er LR og LD begge signifikant større end LS (fig. 4b). For den delmængde af de ovennævnte fælles redigeringssteder, som deles af alle fire coleoider, er FD og LD henholdsvis signifikant større end FS (Fig. 4a) og LS (Fig. 4b), og det samme er FR (Fig. 4a) og LR (Fig. 4b). En signifikant større FD end FS for delt redigering kunne skyldes (i) positiv selektion, der fremmer den indledende fiksering af mutationer, der fører til nonsynonym redigering og/eller (ii) rensende selektion, der forhindrer tab af formodentlig gavnlig nonsynonym redigering; det er derfor en klar indikator for adaptiv nonsynonym redigering. En signifikant større LD end LS for fælles redigering kan skyldes (i) positiv selektion, der fremmer en forøgelse af redigeringsniveauet for formodentlig gavnlig nonsynonym redigering, (ii) rensende selektion, der forhindrer et fald i redigeringsniveauet for formodentlig gavnlig nonsynonym redigering, (iii) rensende selektion, der fortrinsvis forhindrer tabet af nonsynonym redigering på højt niveau, formentlig fordi høje redigeringsniveauer er forbundet med større fordele end lave redigeringsniveauer, og/eller iv) positiv selektion, der fortrinsvis fremmer tabet af nonsynonym redigering på lavt niveau, formentlig fordi en A til G-substitution er begunstiget på et redigeret sted, især når redigeringsniveauet er lavt. Uanset hvad tyder en signifikant større LD over LS også på adaptiv nonsynonym redigering. Derfor viser nonsynonym redigering, der deles af alle fire coleoider, stærke og konsistente adaptive signaler, hvilket tyder på, at en stor del er adaptiv. Til sammenligning viser nonsynonym redigering, der deles mellem blæksprutte og bimac, og den, der deles mellem blæksprutte og blæksprutte, nogle, men ikke alle tegn på tilpasning, og de adaptive signaler er meget svagere, hvilket tyder på, at kun en mindre del er adaptiv.
Hvad er den generelle fordel ved den delte redigering, der viser adaptive signaler? Der findes to hypoteser. For det første kan redigering være gavnlig på grund af den intra-organismiske proteindiversitet, der skabes25,27,32,42. Det vil sige, at redigering muliggør eksistensen af to proteinisoformer pr. redigeret sted i en organisme, hvilket kan give en højere fitness, analogt med heterozygote fordele på polymorfe steder. Alternativt giver redigering en ny isoform, som måske ganske enkelt er bedre egnet end den ikke-redigerede isoform. I denne sidste hypotese er fordelen ved redigering sammenlignelig med fordelen ved en nukleotidudskiftning. For at skelne mellem disse to hypoteser fokuserede vi på steder, der er redigeret i mindst tre af de fire coleoider, fordi redigering burde have eksisteret på disse steder i de fire arters fælles forfader i henhold til parsimoni-princippet (Fig. 2a). Vi estimerede derefter hyppigheden af udskiftning af redigering med en A til G-substitution i nogen af de fire arter. Sådanne erstatninger forventes at være mere eller mindre neutrale for synonym redigering. For nonsynonym redigering er sådanne erstatninger skadelige i henhold til den første hypotese på grund af tabet af proteindiversitet, men er neutrale i henhold til den anden hypotese. Derfor forudsiger den første hypotese en lavere frekvens af sådanne udskiftninger for nonsynonym redigering end for synonym redigering, mens den anden hypotese forudsiger lige store frekvenser af sådanne udskiftninger for synonym og nonsynonym redigering.
Interessant nok er frekvensen af sådanne udskiftninger for nonsynonym redigering signifikant større end for synonym redigering i en tosidet Fisher’s exact test (Fig. 4c og Supplerende tabel 4). Da det er den fælles diversificerende redigering, for hvilken der er spørgsmålstegn ved arten af fordelen, begrænsede vi analysen til kun at omfatte diversificerende redigering, men opnåede et lignende resultat (Fig. 4c og Supplerende tabel 4). Det er bemærkelsesværdigt, at ingen synonym eller nonsynonym redigering blev fundet at blive erstattet med en A-to-C/T-substitution blandt dette sæt af steder (Supplerende tabel 4). Vores fund tyder på, at nonsynonym redigering om noget er mere tilbøjelig til at blive erstattet med en A til G-substitution end synonym redigering, sandsynligvis fordi det at have et genomisk G er bedre end at have et genomisk A, der ikke kan redigeres til G i alle mRNA-molekyler. Med andre ord afviser vores resultater den første hypotese og tyder på, at arten af fordelen ved adaptiv A-to-G-redigering svarer til fordelen ved den samme nukleotid-substitution, selv om størrelsen af fordelen ved førstnævnte er mindre end ved sidstnævnte. Desuden tyder resultatet i Fig. 4c på, at den signifikant større FD end FS for redigering, der deles mellem alle fire coleoider, bedre forklares af positiv selektion, der fremmer den indledende fiksering af mutationer, der førte til gavnlig nonsynonym redigering, end af rensende selektion, der forhindrer tabet af gavnlig nonsynonym redigering.