A nonadaptív hipotézis és annak előrejelzései
Lássunk egy olyan genomi pozíciót egy kódoló régióban, amelyet jelenleg G foglal el, és nem fogad el A-t (lásd az 1a. ábra felső sorát). Ahogy a fajban a szerkesztési aktivitás növekszik, a G-ről-A-ra történő mutáció ezen a helyen semlegessé válhat és rögzülhet, ha a keletkező A-t az mRNS-molekulák kellően nagy hányadában visszaszerkesztik G-vé (lásd az 1a. ábra középső sorát). A G-ről-A-ra történő szubsztitúció után a hely magas szerkesztési szintje szelektíven fennmarad, mivel az mRNS szintjén nem az A, hanem a G megengedett. Mivel a fenti helyzet csak a nemszinonim G-ről-A-ra történő szubsztitúciókra és a kapcsolt nemszinonim A-ról-G-re történő szerkesztésre vonatkozik, felduzzasztja a nemszinonim szerkesztési helyek számát és a nemszinonim szerkesztési szinteket a megfelelő szinonim értékekhez képest. Bár itt a nemszinonim szerkesztés lehetővé tette az egyébként káros G-ről-A-ra történő mutáció rögzülését, a magasan szerkesztett genomiális A-val rendelkező származtatott genotípus nem alkalmasabb, mint a genomiális G-vel rendelkező eredeti genotípus. A fenti forgatókönyvben feltételeztük, hogy a szerkesztés szintje olyan magas, hogy az egyébként káros G-A mutáció semlegessé válik. Az is lehetséges, hogy a szerkesztés szintje nem elég magas, így a G-ről-A-ra történő mutáció enyhén káros (lásd az 1a. ábra alsó sorát). Egy enyhén káros mutáció ennek ellenére rögzülhet, és a szerkesztési szint a későbbi evolúció során szelektíven megemelkedhet. Még ebben a forgatókönyvben sincs nettó fitnesznyereség a G genomot tartalmazó eredeti genotípustól a nagymértékben szerkesztett A genomot tartalmazó származtatott genotípusig. A fenti, mindkét leírt forgatókönyvet magában foglaló, nem adaptív modellt ártalmat megengedő modellnek nevezzük, mivel az RNS-szerkesztés lehetővé teszi az egyébként káros mutációk rögzülését. Bár az RNS-szerkesztés általi ártalomengedélyezés lehetőségét már többször felvetették31,38,39,40 , különösen az organellák transzkriptomjainak szerkesztésével kapcsolatban, empirikus bizonyíték arra vonatkozóan, hogy teljes egészében vagy elsősorban ez a mechanizmus felelős az RNS-szerkesztés “adaptív jeleinek” létrehozásáért, hiányzik.
A koleoid idegszövetek kivételesen magas szerkesztési aktivitását25,27 figyelembe véve feltételezzük, hogy a nem-szinonim szerkesztés jelentett túlsúlya az ártalmat megengedő modellel magyarázható, és nem adaptív. E hipotézis teszteléséhez a nemszinonim szerkesztést két kategóriára osztjuk: helyreállító és diverzifikáló41. A helyreállító szerkesztés az aminosavállapotot visszaalakítja egy ősi állapotba (1b. ábra), míg a diverzifikáló szerkesztés az aminosavállapotot egy nem ősi állapotba alakítja át (1c. ábra). Mivel a helyreállító szerkesztés, de a diverzifikáló szerkesztés nem képes kárt okozó hatást kifejteni, hipotézisünk azt jósolja, hogy a nem szinonim szerkesztés jelentett túlsúlya a koleoidokban a helyreállító, de nem a diverzifikáló szerkesztésnek tulajdonítható. Különösen azt jósoljuk, hogy (i) a szerkesztett helyek gyakorisága nagyobb a helyreállító (FR), mint a szinonim (FS) szerkesztés esetében, és hogy (ii) a szerkesztési szint mediánja magasabb a helyreállító (LR), mint a szinonim (LS) szerkesztés esetében. Előrejelzi továbbá, hogy (iii) a szerkesztett helyek gyakorisága nem nagyobb a diverzifikáló (FD), mint a szinonim (FS) szerkesztés esetében, és hogy (iv) a szerkesztési szint mediánja nem magasabb a diverzifikáló (LD), mint a szinonim (LS) szerkesztés esetében. Ezzel szemben az adaptív hipotézisnek nincsenek specifikus előrejelzései az FR-re és az LR-re vonatkozóan, de azt jósolja, hogy az FD és az LD nagyobb, mint az FS és az LS. Figyelemre méltó, hogy bár csak a helyreállító szerkesztés lehet ártalmatlanító, nem feltétlenül minden helyreállító szerkesztés ártalmatlanító. Például a helyreállító szerkesztés semleges lenne, ha semleges G-A szubsztitúciót állítana vissza.
A helyreállító és diverzifikáló szerkesztés mintái
A nem adaptív hipotézis tesztelésére hat puhatestű faj27 publikált neurális transzkriptomját elemeztük, amelyek filogenetikai kapcsolatait a 2a. ábra mutatja. Közülük a négy koleoidnál a neurális szövetekben széles körben elterjedt a kódoló A-G szerkesztés, míg a két külső csoportban lényegesen kevesebb szerkesztési hely található27.
Ezekben a hat fajban 3587 egy az egyben ortológ gént azonosítottunk, és a fajfa minden belső csomópontjában ősi kódoló szekvenciákra következtettünk (2a. ábra). A fa egy külső csomópontjában bekövetkező olyan nem-szinonim szerkesztési eseményt, amely az aminosavállapotot X-ről Y-ra módosítja, helyreállítónak tekintettük, ha a fa bármelyik, a gyújtópont külső csomópontjának ősi csomópontjában a levezetett genomszekvencia-alapú aminosavállapot Y (1b. ábra; lásd még: Módszerek), vagy diverzifikálónak, ha a fa egyetlen, a gyújtópont külső csomópontjának ősi csomópontjában sincs Y (1c. ábra). Érdemes megjegyezni, hogy ezek a definíciók aminosavállapotokon alapulnak, és csak a nemszinonim szerkesztésre vonatkoznak. A szinonim szerkesztés feltehetően semleges, így nem kell helyreállító és diverzifikáló szerkesztésre elkülöníteni. Továbbá a szinonim szerkesztés két kategóriára történő szétválasztása kevésbé lenne pontos, mivel a szinonim helyeken az ősi szekvenciákra való következtetés megbízhatósága alacsonyabb. A nem szinonim szerkesztési helyek két kategóriája közül a diverzifikáló szerkesztési helyek száma 8,4-13,9-szerese a helyreállító szerkesztési helyek számának a négy koleoidban (1. kiegészítő táblázat).
A négy koleoid mindegyikében az FR és az LR szignifikánsan nagyobb, mint az FS (2b. ábra), illetve az LS (2c. ábra). Ezzel szemben az FD szignifikánsan kisebb, mint az FS (2b. ábra), míg az LD nem különbözik szignifikánsan az LS-től (2c. ábra). Ezek az eredmények megerősítik a nem adaptív hipotézis mind a négy előrejelzését, és ellentmondanak az adaptív hipotézis előrejelzéseinek, ami határozottan arra utal, hogy a nem-szinonim szerkesztés túlsúlya a koleoidokban a kárt megengedő modellel magyarázható és nem adaptív. A 2c. ábra azt mutatja, hogy bár az LR minden koleoidban szignifikánsan magasabb, mint az LS, mégis alacsonyabb, mint 2,5%. Felmerülhet a kérdés, hogy a helyreállító szerkesztés ilyen alacsony medián szintje lehet-e ártalmat megengedő. Mint említettük, nem minden helyreállító szerkesztés feltétlenül ártalmatlanító, ami megmagyarázhatja, hogy az LR miért nem különösen magas. Mindazonáltal a 2c. ábra a restauratív szerkesztés nagyobb hányadát mutatja, mint a szinonim szerkesztésnek, amelynek a szerkesztési szintje számottevő. Például a kalmárban a helyreállító szerkesztési helyek 33,37%-a és 13,31%-a, de a szinonim szerkesztési helyeknek csak 22,97%-a és 6,74%-a rendelkezik >5%-os, illetve >20%-os szerkesztési szinttel. A G-A mutáció károsodásától és az A és G izoformák relatív dominanciájától függően az A-G szerkesztés e jelentős szintjei jelentősen növelhetik a G-A mutáció fixálódási valószínűségét. Azt is meg kell jegyezni, hogy az ártalmat megengedő hipotézist az adaptív hipotézis alternatívájaként javasolták. Ha a nem-szinonim szerkesztés mérsékelt szintje előnyös lehet, ahogy azt az adaptív hipotézis állítja, akkor nincs ok arra, hogy miért ne lehetne ártalmatlanító. Továbbá az LR > LS és LD < LS általános tendenciája az adaptív hipotézishez képest az ártalmat megengedő hipotézist támogatja.
Az eredményeink robusztusságának vizsgálatára négy további elemzést végeztünk. Először is megvizsgáltuk a négy koleoidra jellemző szerkesztési helyeket, illetve azokat, mivel a fajspecifikus szerkesztési események hasonló evolúciós korúak, ami tisztességesebb összehasonlításokat tesz lehetővé. A kapott eredmények nagymértékben hasonlítanak a 2. ábra eredményeihez, és robusztusak a fajspecifikus szerkesztés esetleges téves azonosításával szemben (1. kiegészítő ábra). Másodszor, a bimac egyes szöveteiből azonosított szerkesztési eseményeket vizsgáltuk. Az FR > FS és az FD < FS az összes szövetre érvényes, de a szerkesztési szintek összehasonlításai többnyire nem szignifikánsak, valószínűleg a kisebb mintanagyság miatt csökkent statisztikai erő miatt (2. kiegészítő táblázat). Harmadszor, mivel a szomszédos szerkesztési helyek szerkesztési szintjét egy mutáció együttesen befolyásolhatja, ami csökkentené a statisztikai erőt a szinonim és a nem szinonim szerkesztési helyek összehasonlításában, a génkészlet egyik felében lévő szinonim szerkesztési helyeket hasonlítottuk össze a nem szinonim szerkesztési helyekkel a másik felében. Pontosabban, az összes gént a polip és a tintahal ortológjai közötti dN/dS arány alapján rangsoroltuk, és a páratlan rangú géneket az 1-es, a páros rangúakat pedig a 2-es tárolóba csoportosítottuk. Ezután összehasonlítottuk az 1-es tárolóban lévő szinonim szerkesztést a 2-es tárolóban lévő nem-szinonim szerkesztéssel, valamint a 2-es tárolóban lévő szinonim szerkesztést az 1-es tárolóban lévő nem-szinonim szerkesztéssel. Az eredmények (2. kiegészítő ábra) hasonlóak az összes szerkesztési helyről kapott eredményekhez (2. ábra). Negyedszer az FR/FS és FD/FS értékeket öt szerkesztési szint-tartományban (0-20%, 20-40%, 40-60%, 60-80% és 80-100%) vizsgáltuk az egyes koleoidokban (3. kiegészítő ábra). Mind az FR/FS, mind az FD/FS általában növekszik a szerkesztési szint növekedésével. Bár az FR/FS szinte mindig meghaladja az 1-et, az FD/FS kisebb, mint 1, kivéve, ha a szerkesztési szint meghaladja a 60%-ot. Fontos hangsúlyozni, hogy egy koleoidban a diverzifikáló szerkesztési helyeknek csak néhány százaléka esik ebbe a szerkesztési szint-tartományba (3. kiegészítő táblázat), ami arra utal, hogy a diverzifikáló szerkesztés túlnyomó többsége nem adaptív (a kvantitatív becsléseket lásd alább).
Gyorsított nemszinonim G-A helyettesítések
A károsodást megengedő modell továbbá azt jósolja, hogy a nemszinonim G-A helyettesítésnek a szinonim G-A helyettesítéshez viszonyított arányának (dN/dS a G-A esetében) emelkedettnek kell lennie, mivel a magas szerkesztési aktivitás elfogadhatóvá tesz néhány egyébként káros nemszinonim G-A mutációt. Továbbá, ennek az emelkedésnek különösen hangsúlyosnak kell lennie a kizárólag idegszövetekben kifejeződő génekben, nem pedig az idegszövetekben nem kifejeződő génekben, mivel a magas szerkesztési aktivitás eddig csak az idegszövetekben volt megfigyelhető25,27. Mivel azonban csak a bimak és a tintahal rendelkezik elérhető RNS-szekvenálási adatokkal számos nem idegi szövetből, és mivel az idegi szövetekben nem expresszálódó gének nem szerepelnek a polip és a tintahal transzkriptszekvencia-adataiban, és így kikerültek az igazításainkból, két olyan géncsoportot kellett definiálnunk, amelyek viszonylag magas, illetve viszonylag alacsony specifitással rendelkeznek az idegi expresszióban. A magas neurális expressziós specificitású gének kizárólag neurális szövetekben fejeződnek ki a bimakban vagy a tintahalakban, míg az alacsony neurális expressziós specificitású gének mind a bimakban, mind a tintahalakban neurális és nem neurális szövetekben egyaránt kifejeződnek. Az ártalmat megengedő modell azt jósolja, hogy a G-A-ra vonatkozó dN/dS nagyobb a viszonylag magas neurális expressziós specificitású gének esetében, mint a viszonylag alacsony neutrális expressziós specificitásúak esetében. Mivel a harm-permitting hatás csak akkor van jelen, ha a G-A-ra történő mutáció egy helyen szerkesztés nélkül is káros, a tesztünk érzékenységének növelése érdekében olyan nem-szinonim helyekre összpontosítottunk, amelyek konzerváltak a két outgroup fajban (azaz a nautilus, a tengeri nyúl és a fókuszfajok közvetlen ősi csomópontja azonos szerkesztés előtti állapotban van). Továbbá a dN/dS emelkedésének specifikusnak kell lennie a G-ről-A-ra történő változásokra, mivel más változások, például a C/T-ről-A-ra és a G-ről-C/T-re történő változások potenciális ártalmait nem lehet A-ról-G-re történő szerkesztéssel enyhíteni.
Ezért a négy koleoid közös ősétől leszármazó mind a hat ágat figyelembe vettük. Mindegyik ág dN-jét és dS-ét kiszámítottuk a meglévő és a kikövetkeztetett ősszekvenciák felhasználásával, majd a dN/dS-t úgy számoltuk ki, hogy az összes dN-t elosztottuk ezen ágak összes dS-ével. Előrejelzésünket alátámasztva, a G-ről-A-ra történő változások dN/dS értéke nagyobb a viszonylag magas neurális expressziós specificitású gének esetében, mint a viszonylag alacsony specificitásúaknál (3. ábra). A gének két csoportjának 200-szoros bootstrapelésével, illetve bootstrapelésével megállapítottuk, hogy a fenti különbség statisztikailag szignifikáns (P = 0,015). Ezzel szemben nincs szignifikáns különbség a dN/dS-ben a gének két csoportja között, ha a C/T-A-változásokat vagy a G-C/T-változásokat vesszük figyelembe (3. ábra). Figyelemre méltó, hogy a 3. ábrán a dN/dS < 1 minden esetben, ami összhangban van a pozitív szelekciót nem tartalmazó, ártalmat megengedő modellel.
A fajok közötti közös szerkesztés potenciális előnye
Az a javaslat született, hogy a több faj közötti közös szerkesztés valószínűleg előnyös, mert egyébként a szerkesztési állapot valószínűleg nem evolúciósan konzerválódik36. Ezt a felvetést támasztja alá az a megállapítás, hogy még az emlősöknél is, ahol a legtöbb nemszinonim szerkesztés semlegesnek vagy károsnak tűnik, a nemszinonim szerkesztésnek kitett konzervált helyek gyakorisága mind az emberben, mind az egérben jelentősen meghaladja a szinonim szerkesztésnek kitett konzervált helyek gyakoriságát mindkét fajban36. Hasonló jelenségről számoltak be gyümölcslegyeknél23. A koleoidákban a nemszinonim szerkesztés jelentős hányada legalább két faj között közös, és az erősen szerkesztett helyek általában közösek27. Annak érdekében, hogy megértsük, milyen lehetséges evolúciós erők tartják fenn az RNS-szerkesztést bizonyos helyeken több koleoidban, elemeztük a két vagy több faj kládja által megosztott szerkesztést.
A fajok kládja által megosztott nonsinonim szerkesztési eseményt, amely az aminosavállapotot X-ről Y-ra módosítja, helyreállítónak tekintjük, ha a fa bármely csomópontjában, amely a klád legutóbbi közös ősének őse, a következtetett genomszekvencia-alapú aminosavállapot Y, vagy diverzifikálónak, ha Y nincs jelen ezen ősi csomópontok egyikében sem. A megosztott szerkesztés vizsgálatakor a szerkesztés átlagos szintjét vettük figyelembe abban a kládban, ahol a szerkesztés megosztott. A polip és a bimak, valamint a tintahal és a tintahal között megosztott szerkesztési helyek esetében az FR és az FD egyaránt jelentősen kisebb, mint az FS (4a. ábra). Ezzel szemben az LR és az LD egyaránt szignifikánsan nagyobb, mint az LS (4b. ábra). A fenti közös szerkesztési helyek azon részhalmaza esetében, amelyen mind a négy koleoid osztozik, az FD és az LD szignifikánsan nagyobb, mint az FS (4a. ábra) és az LS (4b. ábra), ahogyan az FR (4a. ábra) és az LR (4b. ábra) is. A közös szerkesztés esetében az FS-nél szignifikánsan nagyobb FD-t a nemszinonim szerkesztéshez vezető mutációk kezdeti rögzülését elősegítő pozitív szelekció és/vagy (ii) a feltehetően előnyös nemszinonim szerkesztés elvesztését megakadályozó tisztító szelekció okozhatja; ezért ez az adaptív nemszinonim szerkesztés egyértelmű indikátora. A megosztott szerkesztés LS-nél lényegesen nagyobb LD-jét (i) a feltehetően előnyös nem-szinonim szerkesztés szerkesztési szintjének növekedését elősegítő pozitív szelekció, (ii) a feltehetően előnyös nem-szinonim szerkesztés szerkesztési szintjének csökkenését megakadályozó tisztító szelekció okozhatja, (iii) a tisztító szelekció előnyben részesíti a magas szintű nemszinonim szerkesztés elvesztését, feltehetően azért, mert a magas szerkesztési szint nagyobb előnyökkel jár, mint az alacsony szerkesztési szint, és/vagy (iv) a pozitív szelekció előnyben részesíti az alacsony szintű nemszinonim szerkesztés elvesztését, valószínűleg azért, mert az A-G helyettesítés előnyben részesül egy szerkesztett helyen, különösen, ha a szerkesztési szint alacsony. Ettől függetlenül az LS-hez képest szignifikánsan nagyobb LD szintén adaptív nem-szinonim szerkesztésre utal. Ennélfogva a mind a négy koleoidban közös nem-szinonim szerkesztés erős és konzisztens adaptív jeleket mutat, ami arra utal, hogy a szerkesztés nagy része adaptív. Ehhez képest a polip és a bimak, valamint a tintahal és a tintahal között közös nem-szinonim szerkesztés az adaptáció néhány, de nem minden jelét mutatja, és az adaptív jelek sokkal gyengébbek, ami arra utal, hogy csak egy kisebb hányaduk adaptív.
Mi az általános előnye az adaptív jeleket mutató közös szerkesztésnek? Két hipotézis létezik. Először is, a szerkesztés előnyös lehet a létrehozott szervezeten belüli fehérjediverzitás miatt25,27,32,42. Vagyis a szerkesztés lehetővé teszi, hogy egy szervezetben szerkesztett helyenként két fehérjeizoforma létezzen, ami magasabb fittséget biztosíthat, a polimorf helyek heterozigóta előnyéhez hasonlóan. Alternatív megoldásként a szerkesztés egy új izoformát kínál, amely egyszerűen alkalmasabb lehet, mint a szerkesztetlen izoforma. Ez utóbbi hipotézis szerint a szerkesztés előnye a nukleotidsubsztitúcióéhoz hasonló. E két hipotézis megkülönböztetése érdekében olyan helyekre összpontosítottunk, amelyek a négy koleoid közül legalább háromban szerkesztettek, mivel a parszimónia elve szerint a négy faj közös ősében ezeken a helyeken már léteznie kellett a szerkesztésnek (2a. ábra). Ezután megbecsültük a szerkesztés A-G helyettesítéssel történő helyettesítésének gyakoriságát a négy faj bármelyikében. Az ilyen helyettesítések várhatóan többé-kevésbé semlegesek a szinonim szerkesztés esetében. A nem szinonim szerkesztés esetében az ilyen helyettesítések az első hipotézis szerint károsak a fehérjék diverzitásának csökkenése miatt, de a második hipotézis szerint semlegesek. Ezért az első hipotézis az ilyen cserék alacsonyabb gyakoriságát jósolja a nem-szinonim szerkesztésnél, mint a szinonim szerkesztésnél, míg a második hipotézis azonos gyakoriságot jósol a szinonim és a nem-szinonim szerkesztésnél.
Érdekes, hogy az ilyen cserék gyakorisága a nem-szinonim szerkesztésnél jelentősen nagyobb, mint a szinonim szerkesztésnél a kétfarkú Fisher-féle egzakt tesztben (4c. ábra és 4. kiegészítő táblázat). Mivel a megosztott diverzifikáló szerkesztés az, amelynél az előny jellege kérdéses, az elemzést csak a diverzifikáló szerkesztésre korlátoztuk, de hasonló eredményt kaptunk (4c. ábra és 4. kiegészítő táblázat). Figyelemre méltó, hogy ezen helyek között nem találtunk olyan szinonim vagy nem szinonim szerkesztést, amelyet A-C/T helyettesítéssel helyettesítettek volna (4. kiegészítő táblázat). Megállapításunk azt sugallja, hogy a nem szinonim szerkesztés nagyobb valószínűséggel helyettesíthető A-G-re, mint a szinonim szerkesztés, valószínűleg azért, mert a genomi G jobb, mint a genomi A, amely nem szerkeszthető G-re minden mRNS-molekulában. Más szóval, eredményeink elutasítják az első hipotézist, és azt sugallják, hogy az adaptív A-G-re történő szerkesztés előnyének jellege hasonló az azonos nukleotid szubsztitúció előnyéhez, bár az előbbi előnyének nagysága kisebb, mint az utóbbié. Továbbá a 4c. ábrán látható eredmény azt sugallja, hogy a szerkesztésre vonatkozó, mind a négy koleoidban közös, szignifikánsan nagyobb FD, mint FS, jobban magyarázható a kedvező nem-szinonim szerkesztéshez vezető mutációk kezdeti rögzülését elősegítő pozitív szelekcióval, mint a kedvező nem-szinonim szerkesztés elvesztését megakadályozó tisztító szelekcióval.