A nonadaptive hypothesis and its predictions
Uvažujme genomickou pozici v kódující oblasti, která je v současnosti obsazena G a nepřijímá A (viz horní řádek na obr. 1a). S rostoucí editační aktivitou druhu se mutace G na A v tomto místě může stát neutrální a fixní, pokud je výsledné A editováno zpět na G v dostatečně velkém podílu molekul mRNA (viz prostřední řádek na obr. 1a). Po záměně G za A se selektivně udrží vysoká úroveň editace v daném místě, protože na úrovni mRNA je přípustné spíše G než A. Vzhledem k tomu, že výše uvedená situace platí pouze pro nesynonymní záměny G-to-A a spojenou nesynonymní editaci A-to-G, nafoukne počet nesynonymních editačních míst a nesynonymní úrovně editace vzhledem k odpovídajícím synonymním hodnotám. Ačkoli zde nesynonymní editace umožnila fixaci jinak škodlivé mutace G-to-A, odvozený genotyp s vysoce editovaným genomem A není vhodnější než původní genotyp s genomem G. Editace je tedy neadaptivní. Ve výše uvedeném scénáři jsme předpokládali, že úroveň editace je tak vysoká, že jinak škodlivá mutace G-to-A se stává neutrální. Je také možné, že úroveň editace není dostatečně vysoká, čímž se mutace G-to-A stává mírně škodlivou (viz spodní řádek na obr. 1a). Mírně škodlivá mutace se nicméně může zafixovat a úroveň editace se může v následné evoluci selektivně zvýšit. Ani podle tohoto scénáře nedochází k čistému nárůstu fitness z původního genotypu s genomem G na odvozený genotyp s genomem A, který je vysoce editovaný. Výše uvedený neadaptivní model zahrnující oba popsané scénáře označujeme jako model umožňující poškození, protože editace RNA umožňuje fixaci jinak škodlivých mutací. Ačkoli možnost harm-permittingu editací RNA byla navržena již vícekrát31,38,39,40, zejména pokud jde o editaci transkriptomů organel, empirické důkazy, že je zcela nebo převážně zodpovědná za vytváření „adaptivních signálů“ editace RNA, chybí.
Vzhledem k mimořádně vysoké aktivitě editace v koleoidních nervových tkáních25,27 předpokládáme, že uváděná převaha nesynonymních editací je vysvětlena modelem povolujícím poškození a není adaptivní. Abychom tuto hypotézu ověřili, rozdělili jsme nesynonymní editace do dvou kategorií: obnovující a diverzifikující41. Restorativní editace převádí stav aminokyselin zpět do ancestrálního stavu (obr. 1b), zatímco diverzifikační editace převádí stav aminokyselin do neancestrálního stavu (obr. 1c). Vzhledem k tomu, že obnovující editace, ale nikoliv diverzifikující editace, může mít škodlivý účinek, naše hypotéza předpovídá, že uváděná převaha nesynonymních editací u coleoidů je způsobena obnovující, ale nikoliv diverzifikující editací. Konkrétně předpokládáme, že (i) frekvence editovaných míst je vyšší u restorativních (FR) než u synonymních (FS) editací a že (ii) medián úrovně editace je vyšší u restorativních (LR) než u synonymních (LS) editací. Dále předpovídá, že (iii) frekvence editovaných míst není vyšší u diverzifikačních (FD) než u synonymních (FS) editací a že (iv) medián úrovně editace není vyšší u diverzifikačních (LD) než u synonymních (LS) editací. Naproti tomu adaptivní hypotéza nemá specifické předpovědi o FR a LR, ale předpovídá, že FD a LD jsou větší než FS respektive LS. Je pozoruhodné, že ačkoli pouze obnovující editace mohou být škodlivé, ne všechny obnovující editace jsou nutně škodlivé. Například restorativní editace by byla neutrální, pokud by obnovovala neutrální substituci G-to-A.
Patterns of restorative and diversifying editing
Pro ověření neadaptivní hypotézy jsme analyzovali publikované neurální transkriptomy šesti druhů měkkýšů27 , jejichž fylogenetické vztahy jsou znázorněny na obr. 2a. Mezi nimi mají čtyři coleoidi v nervových tkáních rozšířenou editaci kódování A-to-G, zatímco dvě outgroups mají podstatně méně editačních míst27.
U těchto šesti druhů jsme identifikovali 3587 ortologických genů jedna ku jedné a odvodili jsme ancestrální kódovací sekvence ve všech vnitřních uzlech druhového stromu (obr. 2a). Nesynonymní editační událost ve vnějším uzlu stromu, která mění stav aminokyseliny z X na Y, jsme považovali za obnovující, pokud je odvozený stav aminokyseliny na základě genomové sekvence Y v jakémkoli uzlu stromu, který je předkem ohniskového vnějšího uzlu (obr. 1b; viz také Metody), nebo diverzifikující, pokud Y není přítomno v žádném uzlu stromu, který je předkem ohniskového vnějšího uzlu (obr. 1c). Je třeba poznamenat, že tyto definice jsou založeny na stavech aminokyselin a vztahují se pouze na nesynonymní úpravy. Synonymní editace je pravděpodobně neutrální, takže nemusí být rozdělena na restorativní a diverzifikační editaci. Navíc rozdělení synonymních editací do dvou kategorií by bylo méně přesné kvůli nižší spolehlivosti při odvozování ancestrálních sekvencí na synonymních místech. Z obou kategorií nesynonymních editačních míst je počet diverzifikujících editačních míst 8,4-13,9krát vyšší než počet restorativních editačních míst ve čtyřech koleoidech (Doplňková tabulka 1).
V každém ze čtyř koleoidů jsou FR a LR výrazně větší než FS (obr. 2b), resp. než LS (obr. 2c). Naopak FD je významně menší než FS (obr. 2b), zatímco LD se od LS významně neliší (obr. 2c). Tyto výsledky potvrzují všechny čtyři předpovědi neadaptivní hypotézy a jsou v rozporu s předpověďmi adaptivní hypotézy, což silně naznačuje, že převaha nesynonymních editací u coleoidů je vysvětlitelná modelem umožňujícím poškození a není adaptivní. Obrázek 2c ukazuje, že ačkoli je LR v každém koleoidu výrazně vyšší než LS, je nižší než 2,5 %. Lze si položit otázku, zda tak nízká mediánová úroveň restorativní editace může být harm-permitting. Jak již bylo zmíněno, ne všechny restorativní editace jsou nutně harm-permitting, což by mohlo vysvětlovat, proč LR není nijak zvlášť vysoká. Nicméně obr. 2c odhaluje větší podíl restorativních úprav než synonymních úprav se znatelnou úrovní úprav. Například u chobotnice má 33,37 % a 13,31 % míst s restorativní editací, ale pouze 22,97 % a 6,74 % míst se synonymní editací úroveň editace >5 %, respektive >20 %. V závislosti na škodlivosti mutace G-to-A a relativní dominanci izoforem A a G by tyto znatelné úrovně editace A-to-G mohly podstatně zvýšit pravděpodobnost fixace mutace G-to-A. Je třeba také poznamenat, že hypotéza umožňující poškození je navržena jako alternativa k adaptivní hypotéze. Pokud by mírné úrovně nesynonymních úprav mohly být prospěšné, jak tvrdí adaptivní hypotéza, není důvod, proč by nemohly být škodlivé. Kromě toho obecný trend LR > LS a LD < LS podporuje hypotézu harm-permitting oproti adaptivní hypotéze.
Pro zkoumání robustnosti našich výsledků jsme provedli čtyři další analýzy. Nejprve jsme zkoumali editační místa, která jsou specifická pro každý ze čtyř coleoidů, protože druhově specifické editační události mají podobné evoluční stáří, což umožňuje spravedlivější srovnání. Získané výsledky jsou velmi podobné výsledkům na obr. 2 a jsou robustní vůči případným chybným identifikacím druhově specifických editací (doplňkový obr. 1). Za druhé jsme zkoumali editační události identifikované z jednotlivých tkání v bimaku. FR > FS a FD < FS platí napříč tkáněmi, ale srovnání úrovně editace jsou většinou nesignifikantní, pravděpodobně kvůli snížené statistické síle v důsledku menší velikosti vzorku (Doplňková tabulka 2). Za třetí, protože úrovně editace sousedních editačních míst mohou být spoluovlivněny mutací, což by snížilo statistickou sílu při porovnávání synonymních a nesynonymních editačních míst, porovnávali jsme synonymní editační místa v jedné polovině souboru genů s nesynonymními editačními místy v druhé polovině. Konkrétně jsme seřadili všechny geny podle poměru dN/dS mezi ortology octomilek a chobotnic, respektive seskupili geny s lichým pořadím do koše 1 a geny se sudým pořadím do koše 2. Poté jsme porovnali synonymní editace v koši 1 s nesynonymními editacemi v koši 2, stejně jako synonymní editace v koši 2 s nesynonymními editacemi v koši 1. Výsledky (doplňkový obr. 2) jsou podobné výsledkům získaným ze všech editačních míst (obr. 2). Začtvrté jsme zkoumali FR/FS, respektive FD/FS v pěti rozmezích úrovně editace (0-20 %, 20-40 %, 40-60 %, 60-80 % a 80-100 %) v každém koleoidu (doplňkový obr. 3). FR/FS i FD/FS se obecně zvyšují s úrovní editace. Ačkoli FR/FS téměř vždy přesahuje hodnotu 1, FD/FS je menší než 1, s výjimkou případů, kdy úroveň editace přesahuje 60 %. Je důležité zdůraznit, že pouze několik procent diverzifikujících editací v koleoidu spadá do tohoto rozmezí úrovně editace (Doplňková tabulka 3), což naznačuje, že naprostá většina diverzifikujících editací je neadaptivní (kvantitativní odhady viz níže).
Zrychlené nesynonymní substituce G-to-A
Model povolující poškození dále předpovídá, že míra nesynonymních substitucí G-to-A vzhledem k míře synonymních substitucí G-to-A (dN/dS pro G-to-A) by měla být zvýšená, protože vysoká editační aktivita činí některé jinak škodlivé nesynonymní mutace G-to-A přijatelnými. Navíc by toto zvýšení mělo být zvláště výrazné u genů exprimovaných výhradně v nervových tkáních, ale ne u genů neexprimovaných v nervových tkáních, protože vysoká editační aktivita je zatím pozorována pouze v nervových tkáních25,27. Protože však pouze bimac a sépie mají k dispozici data ze sekvenování RNA z několika neurálních tkání a protože geny neexprimované v neurálních tkáních nejsou v datech sekvencí transkriptů chobotnic a sépií, a jsou tedy z našich zarovnání vyloučeny, museli jsme definovat dvě skupiny genů s relativně vysokou, resp. relativně nízkou specifitou v neurální expresi. Geny s vysokou specifitou neurální exprese jsou u bimaca nebo chobotnice exprimovány výhradně v neurálních tkáních, zatímco geny s nízkou specifitou neurální exprese jsou u bimaca i chobotnice exprimovány jak v neurálních, tak v neurálních tkáních. Model umožňující poškození předpovídá, že dN/dS pro G-to-A je větší pro geny s relativně vysokou neurální expresní specifitou než pro geny s relativně nízkou neutrální expresní specifitou. Vzhledem k tomu, že harm-permitting efekt je přítomen pouze tehdy, když je mutace G-to-A v místě bez editace škodlivá, zaměřili jsme se na nesynonymní místa, která jsou konzervována u obou outgroup druhů (tj. nautilus, mořský zajíc a bezprostředně předcházející uzel ohniskového druhu sdílejí stejný stav před editací), abychom zvýšili citlivost našeho testu. Kromě toho by zvýšení dN/dS mělo být specifické pro změny z G na A, protože potenciální škodlivost jiných změn, jako jsou změny z C/T na A a z G na C/T, nelze zmírnit úpravou z A na G.
Pro tento účel jsme uvažovali všech šest větví pocházejících od společného předka čtyř coleoidů. Vypočítali jsme dN a dS každé z těchto větví pomocí dochovaných a odvozených sekvencí předků a poté jsme vypočítali dN/dS vydělením celkového dN celkovým dS těchto větví. Na podporu naší předpovědi je dN/dS pro změny z G na A větší u genů s relativně vysokou specifitou nervové exprese než u genů s relativně nízkou specifitou (obr. 3). Odpovídajícím 200násobným bootstrappingem obou skupin genů jsme zjistili, že výše uvedený rozdíl je statisticky významný (P = 0,015). Naopak při zohlednění změn C/T na A nebo G na C/T neexistuje mezi oběma skupinami genů žádný významný rozdíl v dN/dS (obr. 3). Je pozoruhodné, že dN/dS < 1 ve všech případech na obr. 3, což je v souladu s modelem umožňujícím poškození, který nezahrnuje pozitivní selekci.
Potenciální přínos sdílené editace mezi druhy
Bylo navrženo, že sdílená editace mezi více druhy je pravděpodobně přínosná, protože jinak by stav editace pravděpodobně nebyl evolučně konzervován36. Na podporu tohoto předpokladu bylo zjištěno, že i u savců, kde se většina nesynonymních editací jeví jako neutrální nebo škodlivá, frekvence konzervovaných míst podléhajících nesynonymním editacím u člověka i myši výrazně převyšuje frekvenci konzervovaných míst podléhajících synonymním editacím u obou druhů36. Podobný jev byl zaznamenán u ovocných mušek23. U coleoidů je značná část nesynonymních editací sdílená alespoň dvěma druhy a vysoce editovaná místa bývají společná27. Abychom pochopili potenciální evoluční síly udržující editaci RNA na specifických místech u více coleoidů, analyzovali jsme editaci sdílenou kladem dvou nebo více druhů.
Nesynonymní editační událost sdílená kladem druhů, která mění stav aminokyseliny z X na Y, je považována za obnovující, pokud je odvozený stav aminokyseliny na základě genomické sekvence Y v kterémkoli uzlu stromu, který je předkem posledního společného předka kladu, nebo diverzifikující, pokud Y není přítomno v žádném z těchto předkových uzlů. Při studiu sdílené editace jsme uvažovali průměrnou úroveň editace v kladu, kde je editace sdílená. U editací sdílených mezi chobotnicí a bimakem a editací sdílených mezi chobotnicí a sépií jsou FR i FD výrazně menší než FS (obr. 4a). Naopak LR a LD jsou obě výrazně větší než LS (obr. 4b). U podskupiny výše uvedených sdílených editačních míst, která jsou společná pro všechny čtyři coleoidy, jsou FD a LD významně větší než FS (obr. 4a), respektive LS (obr. 4b), stejně tak FR (obr. 4a) a LR (obr. 4b). Výrazně větší FD než FS u sdílených editací by mohla být způsobena (i) pozitivní selekcí podporující počáteční fixaci mutací, které vedou k nesynonymním editacím, a/nebo (ii) očistnou selekcí zabraňující ztrátě pravděpodobně výhodných nesynonymních editací; je tedy jasným indikátorem adaptivních nesynonymních editací. Výrazně větší LD než LS pro sdílené editace by mohla být způsobena (i) pozitivní selekcí podporující zvýšení úrovně editací pravděpodobně prospěšných nesynonymních editací, (ii) purifikační selekcí zabraňující snížení úrovně editací pravděpodobně prospěšných nesynonymních editací, (iii) purifikační selekce přednostně zabraňující ztrátě vysokých úrovní nesynonymních editací pravděpodobně proto, že vysoké úrovně editací jsou spojeny s větším přínosem než nízké úrovně editací, a/nebo (iv) pozitivní selekce přednostně podporující ztrátu nízkých úrovní nesynonymních editací, pravděpodobně proto, že v editovaném místě je upřednostňována záměna A-G, zejména pokud je úroveň editace nízká. Bez ohledu na to, výrazně vyšší LD oproti LS také ukazuje na adaptivní nesynonymní editaci. Nesynonymní editace společné všem čtyřem koleoidům tedy vykazují silné a konzistentní adaptivní signály, což naznačuje, že velká část je adaptivní. Naproti tomu nesynonymní editace sdílené mezi chobotnicí a bimakem a editace sdílené mezi chobotnicí a sépií vykazují některé, ale ne všechny známky adaptace a adaptivní signály jsou mnohem slabší, což naznačuje, že pouze menší část je adaptivní.
Jaký je obecný přínos sdílených editací, které vykazují adaptivní signály? Existují dvě hypotézy. Zaprvé, editace může být prospěšná kvůli vytvořené vnitroorganismové rozmanitosti proteinů25,27,32,42 . To znamená, že editace umožňuje existenci dvou izoforem proteinu na jedno editované místo v organismu, což může přinášet vyšší fitness, analogicky k výhodě heterozygotů na polymorfních místech. Případně editace nabízí novou izoformu, která může být jednoduše vhodnější než needitovaná izoforma. V této druhé hypotéze je výhoda editace srovnatelná s výhodou záměny nukleotidu. Abychom rozlišili mezi těmito dvěma hypotézami, zaměřili jsme se na místa, která jsou editována alespoň u tří ze čtyř coleoidů, protože podle principu parsimonie by editace měla existovat na těchto místech u společného předka čtyř druhů (obr. 2a). Poté jsme odhadli frekvenci nahrazení editace substitucí A-to-G u některého ze čtyř druhů. Očekává se, že takové záměny budou u synonymních editací víceméně neutrální. U nesynonymních editací jsou takové záměny podle první hypotézy škodlivé v důsledku ztráty diverzity proteinů, ale podle druhé hypotézy jsou neutrální. Proto první hypotéza předpovídá nižší frekvenci takových záměn pro nesynonymní úpravy než pro synonymní úpravy, zatímco druhá hypotéza předpovídá stejnou frekvenci takových záměn pro synonymní i nesynonymní úpravy.
Zajímavé je, že frekvence takových záměn pro nesynonymní úpravy je významně vyšší než pro synonymní úpravy v dvouvýběrovém Fisherově přesném testu (obr. 4c a doplňková tabulka 4). Protože se jedná o sdílené diverzifikující editace, u nichž je povaha přínosu sporná, omezili jsme analýzu pouze na diverzifikující editace, ale získali jsme podobný výsledek (obr. 4c a doplňková tabulka 4). Je pozoruhodné, že mezi tímto souborem míst nebyla nalezena žádná synonymní ani nesynonymní editace nahrazená substitucí A-C/T (doplňková tabulka 4). Naše zjištění naznačuje, že pokud vůbec, je pravděpodobnější, že nesynonymní editace bude nahrazena substitucí A na G než synonymní editace, pravděpodobně proto, že mít genomické G je lepší než mít genomické A, které nemůže být editováno na G ve všech molekulách mRNA. Jinými slovy, naše výsledky zamítají první hypotézu a naznačují, že povaha přínosu adaptivní editace z A na G je podobná jako u stejné nukleotidové substituce, i když velikost přínosu z první je menší než z druhé. Zjištění na obr. 4c navíc naznačuje, že výrazně větší FD než FS pro editaci společná pro všechny čtyři koleoidy je lépe vysvětlitelná pozitivní selekcí podporující počáteční fixaci mutací, které vedly k výhodné nesynonymní editaci, než očistnou selekcí zabraňující ztrátě výhodné nesynonymní edice.