Övervikten av nonsynonym A-to-I RNA-redigering i coleoider är icke-adaptiv

En icke-adaptiv hypotes och dess förutsägelser

Låt oss betrakta en genomisk position i en kodande region som för närvarande är upptagen av G och som inte accepterar A (se den översta raden i fig. 1a). När redigeringsaktiviteten i arten ökar kan en G-till-A-mutation på platsen bli neutral och fixerad om den resulterande A redigeras tillbaka till G i en tillräckligt stor andel av mRNA-molekylerna (se den mellersta raden i fig. 1a). Vid utbytet från G till A kommer den höga redigeringsnivån på platsen att upprätthållas selektivt, eftersom det är G snarare än A som är tillåtet på mRNA-nivå. Eftersom ovanstående situation endast gäller nonsynonyma G-till-A-substitutioner och den kopplade nonsynonyma A-till-G-redigeringen, ökar den antalet nonsynonyma redigeringsställen och nonsynonyma redigeringsnivåer i förhållande till motsvarande synonyma värden. Även om den nonsynonyma redigeringen här har gjort det möjligt att fixera den annars skadliga G-till-A-mutationen, är den härledda genotypen med ett genomiskt A som är starkt redigerat inte bättre än den ursprungliga genotypen med ett genomiskt G. Redigeringen är alltså icke-adaptiv. I ovanstående scenario antog vi att redigeringsnivån är så hög att den annars skadliga G-till-A-mutationen blir neutral. Det är också möjligt att redigeringsnivån inte är tillräckligt hög, vilket gör att G-till-A-mutationen blir något skadlig (se nedersta raden i figur 1a). En något skadlig mutation kan ändå fixeras och redigeringsnivån kan höjas selektivt i den efterföljande evolutionen. Inte ens i detta scenario finns det någon nettoförbättring av fitness från den ursprungliga genotypen med ett genomiskt G till den härledda genotypen med ett genomiskt A som är starkt redigerat. Vi kallar den ovan nämnda icke-adaptiva modellen, som omfattar båda de beskrivna scenarierna, för ”harm-permitting-modellen”, eftersom RNA-redigering tillåter fixering av mutationer som annars skulle vara skadliga. Även om möjligheten att RNA-redigering tillåter skada har föreslagits flera gånger31,38,39,40, särskilt när det gäller redigering av organella transkriptom, saknas empiriska bevis för att den helt eller huvudsakligen är ansvarig för att skapa ”adaptiva signaler” av RNA-redigering.

Figur 1

Den skadebegränsande modellen och en strategi för att upptäcka den skadebegränsande effekten. a Den skadebegränsande effekten av nonsynonym redigering. Den översta raden visar att när en nonsynonym A-sida inte redigeras (eller är föremål för en låg nivå av redigering) är en G-till-A-mutation på denna sida alltför skadlig för att kunna åtgärdas. Den mellersta raden visar att när platsen är starkt redigerad blir G-till-A-mutationen neutral och fixeras genom genetisk drift. Den höga redigeringsnivån är då selektivt begränsad. Den nedre raden visar att när redigeringsnivån för platsen är medelhög blir G-till-A-mutationen något skadlig och fixeras genom genetisk drift. Redigeringsnivån kan höjas ytterligare genom positivt urval (eller bibehållas genom negativt urval). Trots de relativt höga nonsynonyma redigeringsnivåerna i de mellersta och nedersta raderna skedde ingen anpassning (dvs. ingen nettoökning av fitness) när den slutliga genotypen jämförs med den ursprungliga genotypen. DNA visas i blått, medan RNA visas i rött. Efterredigerade nukleotider är markerade med stjärnor. b Restorativ redigering återställer ett ursprungligt aminosyratillstånd som gått förlorat vid ett aminosyrabyte, vilket kan ha inträffat i den yttre grenen som visas här eller i en tidigare gren. Med andra ord är tillståndet efter redigeringen identiskt med tillståndet före redigeringen. c Diversifierande redigering skapar ett aminosyratillstånd som skiljer sig från tillstånden före redigeringen i en uppsättning av de berörda förfäderna. Även om endast tillståndet hos en förfader visas här, kan tillstånden hos flera förfäder beaktas. I b och c representerar X och Y olika aminosyratillstånd, medan pilen visar effekten av redigeringen. Återställande men inte diversifierande redigering kan ge en harm-permitting-effekt.

Med tanke på den exceptionellt höga redigeringsaktiviteten i coleoida neurala vävnader25,27 antar vi att den rapporterade övervikten av icke-synonym redigering förklaras av harm-permitting-modellen och inte är adaptiv. För att testa denna hypotes delar vi in icke-synonym redigering i två kategorier: återställande och diversifierande41. Restaurativ redigering omvandlar aminosyratillståndet tillbaka till ett ursprungligt tillstånd (fig. 1b), medan diversifierande redigering omvandlar aminosyratillståndet till ett icke ursprungligt tillstånd (fig. 1c). Eftersom restorativ redigering, men inte diversifierande redigering, kan ge en skadlig effekt, förutsäger vår hypotes att den rapporterade övervikten av nonsynonym redigering i koloider kan tillskrivas restorativ men inte diversifierande redigering. Vi förutsäger särskilt att i) frekvensen av redigerade platser är högre för restorativ (FR) än för synonym (FS) redigering, och att ii) medianredigeringsnivån är högre för restorativ (LR) än för synonym (LS) redigering. Vidare förutspås att iii) frekvensen av redigerade platser inte är större för diversifierande (FD) än för synonym (FS) redigering, och att iv) medianen av redigeringsnivån inte är högre för diversifierande (LD) än för synonym (LS) redigering. Den adaptiva hypotesen har däremot inga specifika förutsägelser om FR och LR, men förutsäger att FD och LD är större än FS och LS. Det är värt att notera att även om endast återställande redigering kan vara skadebegränsande, är inte all återställande redigering nödvändigtvis skadebegränsande. Till exempel skulle den restorativa redigeringen vara neutral om den återställer en neutral G-till-A-substitution.

Mönster för restorativ och diversifierande redigering

För att testa den icke-adaptiva hypotesen analyserade vi de publicerade neurala transkriptomerna från sex blötdjursarter27, vars fylogenetiska relationer avbildas i fig. 2a. Bland dem har de fyra coleoiderna utbredd kodande A till G-redigering i neurala vävnader, medan de två utgrupper har betydligt färre redigeringsställen27.

Vi identifierade 3587 ortologiska en-till-en-gener i dessa sex arter och härledde förfädernas kodande sekvenser vid alla inre noder i artsträdet (Fig. 2a). Vi betraktade en nonsynonym redigeringshändelse i en yttre nod i trädet som ändrar aminosyratillståndet från X till Y som återställande om det härledda genomsekvensbaserade aminosyratillståndet är Y i någon nod i trädet som är anor till den fokala yttre noden (Fig. 1b; se även Metod), eller diversifierande om Y inte finns i någon nod i trädet som är anor till den fokala yttre noden (Fig. 1c). Det är värt att notera att dessa definitioner är baserade på aminosyratillstånd och endast tillämpas på nonsynonym redigering. Synonym redigering är förmodligen neutral och behöver därför inte delas upp i restaurerande och diversifierande redigering. Dessutom skulle en uppdelning av synonym redigering i de två kategorierna vara mindre exakt på grund av lägre tillförlitlighet när det gäller att härleda förfädernas sekvenser på synonyma platser. Av de två kategorierna av nonsynonyma redigeringsställen är antalet diversifierande redigeringsställen 8,4-13,9 gånger större än antalet restorativa redigeringsställen i de fyra coleoiderna (kompletterande tabell 1).

I var och en av de fyra coleoiderna är FR och LR signifikant större än FS (fig. 2b) respektive LS (fig. 2c). Däremot är FD signifikant mindre än FS (fig. 2b), medan LD inte skiljer sig signifikant från LS (fig. 2c). Dessa resultat bekräftar alla fyra förutsägelserna i den icke-adaptiva hypotesen och står i strid med förutsägelserna i den adaptiva hypotesen, vilket starkt tyder på att övervikten av icke-synonym redigering i coleoider förklaras av den skadebegränsande modellen och är icke-adaptiv. Figur 2c visar att även om LR är betydligt högre än LS i varje coleoid är den lägre än 2,5 %. Man kan fråga sig om så låga mediannivåer av återställande redigering kan vara skadebegränsande. Som nämnts är inte all återställande redigering nödvändigtvis skadebegränsande, vilket skulle kunna förklara varför LR inte är särskilt hög. Trots detta visar fig. 2c att det finns en större andel restaurerande redigering än synonym redigering med märkbara redigeringsnivåer. I bläckfisken har till exempel 33,37 % och 13,31 % av de restorativa redigeringsställena men endast 22,97 % och 6,74 % av de synonyma redigeringsställena redigeringsnivåer >5 % respektive >20 %. Beroende på hur skadlig G-till-A-mutationen är och den relativa dominansen av A- och G-isoformerna kan dessa märkbara nivåer av A till G-redigering avsevärt öka sannolikheten för att G-till-A-mutationen fixeras. Det bör också noteras att hypotesen om att skadan kan uppkomma föreslås som ett alternativ till den adaptiva hypotesen. Om måttliga nivåer av nonsynonym redigering kan vara fördelaktig enligt den adaptiva hypotesen, finns det ingen anledning till varför de inte skulle kunna vara skadliga. Dessutom stöder den allmänna trenden för LR > LS och LD < LS den skadliga hypotesen i förhållande till den adaptiva hypotesen.

För att undersöka hur robusta våra resultat är genomförde vi fyra ytterligare analyser. För det första undersökte vi respektive redigeringsställen som är specifika för var och en av de fyra coleoiderna, eftersom artspecifika redigeringshändelser har liknande evolutionära åldrar, vilket möjliggör rättvisare jämförelser. De erhållna resultaten liknar i hög grad resultaten i figur 2 och är robusta mot eventuella felidentifieringar av artspecifik redigering (kompletterande figur 1). För det andra undersökte vi redigeringshändelser som identifierats från enskilda vävnader hos bimac. FR > FS och FD < FS gäller för alla vävnader, men jämförelser av redigeringsnivåer är mestadels icke-signifikanta, vilket sannolikt beror på den minskade statistiska styrkan till följd av minskade provstorlekar (kompletterande tabell 2). För det tredje, eftersom redigeringsnivåer för angränsande redigeringsställen kan påverkas gemensamt av en mutation, vilket skulle minska den statistiska styrkan i jämförelsen mellan synonyma och icke-synonyma redigeringsställen, jämförde vi synonyma redigeringsställen i den ena halvan av genuppsättningen med icke-synonyma redigeringsställen i den andra halvan. Närmare bestämt rangordnade vi alla gener efter förhållandet dN/dS mellan ortologer från bläckfisk och bläckfisk och grupperade gener med udda rang i bin 1 respektive gener med jämna rang i bin 2. Vi jämförde sedan den synonyma redigeringen i bin 1 med den icke-synonyma redigeringen i bin 2 samt den synonyma redigeringen i bin 2 med den icke-synonyma redigeringen i bin 1. Resultaten (kompletterande figur 2) liknar de som erhållits för alla redigeringsställen (fig. 2). För det fjärde undersökte vi FR/FS respektive FD/FS i fem redigeringsnivåintervall (0-20 %, 20-40 %, 40-60 %, 60-80 % och 80-100 %) i varje coleoid (kompletterande figur 3). Både FR/FS och FD/FS ökar i allmänhet med redigeringsnivån. Även om FR/FS nästan alltid överstiger 1 är FD/FS mindre än 1, utom när redigeringsnivån överstiger 60 %. Det är viktigt att betona att endast några få procent av de diversifierande redigeringsplatserna i en coleoid faller inom detta redigeringsnivåintervall (kompletterande tabell 3), vilket tyder på att den stora majoriteten av den diversifierande redigeringen är icke-adaptiv (se nedan för kvantitativa uppskattningar).

Accelererade nonsynonyma G-till-A-substitutioner

Den skadegörande modellen förutsäger vidare att hastigheten för nonsynonyma G-till-A-substitutioner i förhållande till den för synonyma G-till-A-substitutioner (dN/dS för G-till-A) bör vara förhöjd, eftersom den höga editeringsaktiviteten gör vissa annars skadliga nonsynonyma G-till-A-mutationer acceptabla. Dessutom bör denna ökning vara särskilt uttalad i gener som uteslutande uttrycks i neurala vävnader, men inte i gener som inte uttrycks i neurala vävnader, eftersom den höga redigeringsaktiviteten hittills endast har observerats i neurala vävnader25,27. Eftersom endast bimac och bläckfisk har tillgängliga RNA-sekvenseringsdata från flera icke-neurala vävnader och eftersom gener som inte uttrycks i neurala vävnader inte finns med i transkriptsekvensdata från bläckfisk och bläckfisk, och därför utesluts från våra anpassningar, var vi dock tvungna att definiera två grupper av gener med relativt hög respektive relativt låg specificitet i neurala uttryck. Generna med hög specificitet för neurala uttryck uttrycks uteslutande i neurala vävnader hos bimacken eller bläckfisken, medan generna med låg specificitet för neurala uttryck uttrycks i både neurala och icke-neurala vävnader hos både bimacken och bläckfisken. Den skadliga modellen förutsäger att dN/dS för G-to-A är större för gener med relativt hög neural uttrycksspecificitet än för gener med relativt låg neutral uttrycksspecificitet. Eftersom harm-permitting-effekten endast är närvarande när en G-till-A-mutation på en plats är skadlig utan redigering, fokuserade vi på nonsynonyma platser som är bevarade i de två outgroup-arterna (dvs. nautilus, sjöhare och den omedelbart anorala noden till den fokala arten delar samma tillstånd före redigering) för att öka känsligheten hos vårt test. Vidare bör förhöjningen av dN/dS vara specifik för G-till-A-ändringar, eftersom de potentiella skadorna av andra förändringar som C/T-till-A och G-till-C/T inte kan lindras av A-till-G-redigering.

För detta ändamål betraktade vi alla sex grenar som härstammar från den gemensamma förfadern för de fyra coleoiderna. Vi beräknade dN och dS för var och en av dessa grenar med hjälp av de bevarade och härledda förfäderssekvenserna och beräknade sedan dN/dS genom att dividera det totala dN med det totala dS för dessa grenar. Som stöd för vår förutsägelse är dN/dS för G-till-A-ändringar större för gener med relativt hög specificitet för neurala uttryck än för gener med relativt låg specificitet (fig. 3). Genom att respektive bootstrappa de två grupperna av gener 200 gånger fann vi att ovanstående skillnad är statistiskt signifikant (P = 0,015). Däremot finns det ingen signifikant skillnad i dN/dS mellan de två gengrupperna när C/T-till-A-ändringar eller G-till-C/T-ändringar beaktas (fig. 3). Det är anmärkningsvärt att dN/dS < 1 i alla fall i fig. 3, vilket är förenligt med den skadebegränsande modellen som inte inbegriper positivt urval.

Fig. 3

Coleoid nonsynonyma till synonyma substitutionshastighetskvoter (dN/dS) för olika nukleotidändringar. P-värdet är baserat på 200 bootstrapprov; ns, ej signifikant. Källdata tillhandahålls som en Source Data-fil.

Den potentiella fördelen med delad redigering mellan arter

Det har föreslagits att delad redigering mellan flera arter sannolikt är fördelaktigt, eftersom det annars är osannolikt att redigeringsstatusen är evolutionärt bevarad36. Till stöd för detta förslag finns upptäckten att även hos däggdjur, där de flesta nonsynonyma redigeringar verkar neutrala eller skadliga, överstiger frekvensen av bevarade platser som är föremål för nonsynonym redigering hos både människa och mus betydligt frekvensen av bevarade platser som är föremål för synonym redigering hos båda arterna36. Ett liknande fenomen har rapporterats hos fruktflugor23. Hos coleoider delas en betydande del av den nonsynonyma redigeringen av minst två arter och högt redigerade platser tenderar att delas27. För att förstå de potentiella evolutionära krafter som upprätthåller RNA-redigering på specifika platser i flera coleoider analyserade vi redigering som delas av en klad av två eller flera arter.

En nonsynonym redigeringshändelse som delas av en klad av arter och som ändrar aminosyrestatusen från X till Y betraktas som restaurerande om den härledda genomiska sekvensen baserade aminosyrestatusen är Y i någon av de noder i trädet som är förfäder till den senaste gemensamma förfadern till kladen, eller som diversifierande om Y inte förekommer vid någon av dessa förfäder. I studien av delad redigering tog vi hänsyn till den genomsnittliga redigeringsnivån i den klad där redigeringen är delad. För redigeringsställen som delas mellan bläckfisk och bimac, och de som delas mellan bläckfisk och bläckfisk, är FR och FD båda betydligt mindre än FS (fig. 4a). Däremot är LR och LD båda signifikant större än LS (fig. 4b). För den delmängd av de ovan nämnda gemensamma redigeringsplatserna som delas av alla fyra coleoiderna är FD och LD signifikant större än FS (fig. 4a) respektive LS (fig. 4b), liksom FR (fig. 4a) och LR (fig. 4b). En signifikant större FD än FS för delad redigering kan orsakas av i) positivt urval som främjar den initiala fixeringen av mutationer som leder till nonsynonym redigering och/eller ii) renande urval som förhindrar förlusten av förmodat fördelaktig nonsynonym redigering; därför är det en tydlig indikator på adaptiv nonsynonym redigering. En betydligt större LD än LS för delad redigering kan orsakas av i) positivt urval som främjar en ökning av redigeringsnivåerna för förmodat fördelaktig nonsynonym redigering, ii) renande urval som förhindrar en minskning av redigeringsnivåerna för förmodat fördelaktig nonsynonym redigering, (iii) renande urval som företrädesvis förhindrar förlusten av nonsynonym redigering på hög nivå, förmodligen för att höga redigeringsnivåer är förknippade med större fördelar än låga redigeringsnivåer, och/eller iv) positivt urval som företrädesvis främjar förlusten av nonsynonym redigering på låg nivå, förmodligen för att en A till G-substitution gynnas på en redigerad plats, särskilt när redigeringsnivån är låg. Oavsett detta indikerar en signifikant större LD jämfört med LS också adaptiv nonsynonym redigering. Därför uppvisar nonsynonym redigering som delas av alla fyra coleoiderna starka och konsekventa adaptiva signaler, vilket tyder på att en stor del är adaptiv. I jämförelse uppvisar nonsynonym redigering som delas mellan bläckfisk och bimac, och den som delas mellan bläckfisk och bläckfisk vissa men inte alla tecken på anpassning, och de adaptiva signalerna är mycket svagare, vilket tyder på att endast en mindre del är adaptiv.

Vad är den allmänna fördelen med den delade redigering som visar adaptiva signaler? Det finns två hypoteser. För det första kan redigering vara fördelaktig på grund av den proteindiversitet inom organismen som skapas25,27,32,42. Det vill säga, redigering möjliggör förekomsten av två proteinisoformer per redigerad plats i en organism, vilket kan ge en högre fitness, analogt med heterozygot fördel vid polymorfa platser. Alternativt erbjuder redigering en ny isoform som helt enkelt kan vara bättre än den oredigerade isoformen. I den senare hypotesen är fördelarna med redigering jämförbara med fördelarna med ett nukleotidbyte. För att skilja mellan dessa två hypoteser fokuserade vi på platser som redigeras i minst tre av de fyra coleoiderna, eftersom redigering borde ha funnits på dessa platser i de fyra arternas gemensamma förfader enligt parsimoni-principen (fig. 2a). Vi uppskattade sedan frekvensen av ersättning av redigering med en A till G-substitution i någon av de fyra arterna. Sådana ersättningar förväntas vara mer eller mindre neutrala för synonym redigering. För nonsynonym redigering är sådana ersättningar skadliga enligt den första hypotesen på grund av förlusten av proteindiversitet, men neutrala enligt den andra hypotesen. Därför förutsäger den första hypotesen en lägre frekvens av sådana ersättningar för nonsynonym redigering än för synonym redigering, medan den andra hypotesen förutsäger lika stora frekvenser av sådana ersättningar för synonym och nonsynonym redigering.

Interessant nog är frekvensen av sådana ersättningar för nonsynonym redigering signifikant större än för synonym redigering i ett tvåsidigt exakta Fisher-test (fig. 4c och kompletterande tabell 4). Eftersom det är den delade diversifierande redigeringen för vilken fördelens karaktär är ifrågasatt begränsade vi analysen till enbart diversifierande redigering, men fick ett liknande resultat (fig. 4c och kompletterande tabell 4). Det är anmärkningsvärt att ingen synonym eller nonsynonym redigering hittades som ersattes med en A-to-C/T-substitution bland denna uppsättning platser (kompletterande tabell 4). Vårt resultat tyder på att, om något, är det mer sannolikt att nonsynonym redigering ersätts med en A till G-substitution än att synonym redigering ersätts med en A till G-substitution, troligen på grund av att det är bättre att ha ett genomiskt G än att ha ett genomiskt A som inte kan redigeras till G i alla mRNA-molekyler. Med andra ord förkastar våra resultat den första hypotesen och tyder på att arten av fördelen av adaptiv A-to-G-redigering liknar den av samma nukleotidersättning, även om storleken på fördelen av den förstnämnda är mindre än den av den sistnämnda. Dessutom tyder resultatet i fig. 4c på att den betydligt större FD än FS för redigering som delas av alla fyra kolloiderna bättre förklaras av positivt urval som främjar den initiala fixeringen av mutationer som ledde till fördelaktig nonsynonym redigering än renande urval som förhindrar förlusten av fördelaktig nonsynonym redigering.

Lämna ett svar

Din e-postadress kommer inte publiceras.