The preponderance of nonsynonymous A-to-I RNA editing in coleoids is nonadaptive

A nonadaptive hypothesis and its predictions

Rozważmy pozycję genomową w regionie kodującym, która jest obecnie zajęta przez G i nie akceptuje A (patrz górny rząd na Rys. 1a). W miarę wzrostu aktywności edycyjnej u danego gatunku, mutacja G na A w tym miejscu może stać się neutralna i utrwalona, jeśli powstałe A jest edytowane z powrotem na G w wystarczająco dużej części cząsteczek mRNA (patrz środkowy rząd na Rys. 1a). Po substytucji G do A wysoki poziom redagowania w tym miejscu zostanie selektywnie utrzymany, ponieważ to G, a nie A jest dopuszczalne na poziomie mRNA. Ponieważ powyższa sytuacja dotyczy tylko nonsynonimicznej substytucji G na A i sprzężonej z nią nonsynonimicznej edycji A na G, zawyża ona liczbę miejsc edycji nonsynonimicznej i poziomy edycji nonsynonimicznej w stosunku do odpowiadających im wartości synonimicznych. Chociaż w tym przypadku edycja nonsynonimiczna umożliwiła utrwalenie szkodliwej mutacji G do A, genotyp pochodny z genomowym A, który jest wysoce zredagowany, nie jest bardziej dopasowany niż oryginalny genotyp z genomowym G. Zatem edycja jest nieadaptacyjna. W powyższym scenariuszu założyliśmy, że poziom edycji jest tak wysoki, że w przeciwnym razie szkodliwa mutacja G do A staje się neutralna. Możliwe jest również, że poziom edycji nie jest wystarczająco wysoki, co sprawia, że mutacja G do A jest nieznacznie delektująca (patrz dolny rząd na Rys. 1a). Lekko deleteryjna mutacja może jednak zostać utrwalona, a poziom edycji może zostać selektywnie zwiększony w dalszej ewolucji. Nawet przy takim scenariuszu nie ma zysku netto na kondycji z oryginalnego genotypu z genomem G do genotypu pochodnego z genomem A, który jest wysoce zredagowany. Powyższy model nieadaptacyjny, zawierający oba opisane scenariusze, nazywamy modelem dopuszczającym szkody, ponieważ edycja RNA pozwala na utrwalanie szkodliwych mutacji. Chociaż możliwość harm-permitting przez edycję RNA była wielokrotnie proponowana31,38,39,40, szczególnie w odniesieniu do edycji transkryptomów organelli, brakuje empirycznych dowodów, że jest ona całkowicie lub głównie odpowiedzialna za tworzenie „adaptacyjnych sygnałów” edycji RNA.

Rys. 1

Model harm-permitting i strategia wykrywania efektu harm-permitting. a Efekt harm-permitting edycji nonsynonimicznej. Górny rząd pokazuje, że gdy nonsynonimiczne miejsce A nie jest edytowane (lub podlega niskiemu poziomowi edycji), mutacja G na A w tym miejscu jest zbyt szkodliwa, by zostać naprawiona. Środkowy rząd pokazuje, że gdy miejsce to jest wysoko edytowane, mutacja G do A staje się neutralna i jest utrwalana przez dryf genetyczny. Wysoki poziom edycji jest wtedy selektywnie ograniczany. Dolny rząd pokazuje, że gdy poziom edycji miejsca jest pośredni, mutacja G-to-A jest nieznacznie szkodliwa i utrwalana przez dryf genetyczny. Poziom edycji może być dalej podnoszony przez selekcję pozytywną (lub utrzymywany przez selekcję negatywną). Pomimo stosunkowo wysokiego poziomu edycji nonsynonimicznej w środkowym i dolnym rzędzie, nie nastąpiła adaptacja (tj. nie nastąpił wzrost netto kondycji), gdy końcowy genotyp jest porównywany z genotypem pierwotnym. DNA jest zaznaczone na niebiesko, a RNA na czerwono. Nukleotydy po edycji oznaczono gwiazdkami. b Edycja restytucyjna przywraca stan aminokwasów utracony w wyniku substytucji aminokwasów, która mogła nastąpić w przedstawionej tu gałęzi zewnętrznej lub w gałęzi wcześniejszej. Innymi słowy, stan po edycji jest identyczny ze stanem przodka sprzed edycji. c Edycja różnicująca tworzy stan aminokwasów, który różni się od stanów sprzed edycji w zestawie rozważanych przodków. Chociaż pokazany jest tu tylko stan jednego przodka, można rozważyć stany wielu przodków. W b i c, X i Y reprezentują różne stany aminokwasów, podczas gdy strzałka pokazuje efekt edycji. Biorąc pod uwagę wyjątkowo wysoką aktywność edytowania w neuronalnych tkankach koleoidalnych25,27, wysunęliśmy hipotezę, że zgłoszona przewaga edytowania nonsynonimicznego jest wyjaśniona przez model harm-permitting i jest nieadaptacyjna. Aby przetestować tę hipotezę, dzielimy edycję nonsynonimiczną na dwie kategorie: odtwórczą i różnicującą41. Edycja restoracyjna przekształca stan aminokwasów z powrotem do stanu przodka (Rys. 1b), podczas gdy edycja różnicująca przekształca stan aminokwasów do stanu nie przodka (Rys. 1c). Ponieważ redagowanie restytucyjne, a nie różnicujące, może nadawać efekt „harm-permitting”, nasza hipoteza przewiduje, że odnotowana przewaga redagowania nonsynonimicznego w koleoidach jest przypisywana redagowaniu restytucyjnemu, a nie różnicującemu. W szczególności przewidujemy, że (i) częstość miejsc poddanych edycji jest większa w przypadku edycji restoracyjnej (FR) niż synonimicznej (FS), oraz że (ii) mediana poziomu edycji jest wyższa w przypadku edycji restoracyjnej (LR) niż synonimicznej (LS). Przewiduje ona również, że (iii) częstotliwość edytowanych miejsc nie jest większa w przypadku redagowania różnicującego (FD) niż synonimicznego (FS) oraz że (iv) mediana poziomu redagowania nie jest wyższa w przypadku redagowania różnicującego (LD) niż synonimicznego (LS). Z kolei hipoteza adaptacyjna nie zawiera specyficznych przewidywań dotyczących FR i LR, ale przewiduje, że FD i LD są odpowiednio większe niż FS i LS. Warto zauważyć, że chociaż tylko redagowanie naprawcze może być szkodliwe, to nie wszystkie redagowania naprawcze są koniecznie szkodliwe. Na przykład, redagowanie restytucyjne byłoby neutralne, gdyby przywracało neutralną substytucję G do A.

Patterns of restorative and diversifying editing

Aby przetestować hipotezę nieadaptacyjną, przeanalizowaliśmy opublikowane transkryptomy neuronalne sześciu gatunków mięczaków27, których relacje filogenetyczne przedstawiono na Rys. 2a. Wśród nich, cztery coleoidy mają szeroko rozpowszechnioną edycję kodowania A-to-G w tkankach neuronalnych, podczas gdy dwie outgroups mają znacznie mniej miejsc edycji27.

Zidentyfikowaliśmy 3587 jeden do jednego ortologicznych genów w tych sześciu gatunkach i wywnioskowaliśmy ancestralne sekwencje kodujące we wszystkich wewnętrznych węzłach drzewa gatunkowego (Fig. 2a). Uznaliśmy, że nonsynonimiczne zdarzenie edycyjne w zewnętrznym węźle drzewa, które zmienia stan aminokwasów z X na Y jest restytucyjne, jeśli stan aminokwasów oparty na sekwencji genomowej jest Y w każdym węźle drzewa, który jest przodkiem głównego węzła zewnętrznego (Ryc. 1b; patrz też Metody), lub różnicujące, jeśli Y nie jest obecne w żadnym węźle drzewa, który jest przodkiem głównego węzła zewnętrznego (Ryc. 1c). Warto zauważyć, że definicje te opierają się na stanach aminokwasów i są stosowane tylko do edycji niesynonimicznej. Edycja synonimiczna jest przypuszczalnie neutralna, więc nie musi być rozdzielana na edycję restytucyjną i różnicującą. Co więcej, rozdzielenie edycji synonimicznej na te dwie kategorie byłoby mniej dokładne z powodu mniejszej wiarygodności we wnioskowaniu o sekwencjach przodków w miejscach synonimicznych. Spośród dwóch kategorii miejsc edycji nonsynonimicznej, liczba miejsc edycji różnicującej jest 8,4-13,9 razy większa od liczby miejsc edycji restoracyjnej w czterech kolemoidach (Tabela 1).

W każdym z czterech kolemoidów, FR i LR są znacząco większe niż FS (Ryc. 2b) i LS (Ryc. 2c), odpowiednio. Natomiast FD jest istotnie mniejszy od FS (Rys. 2b), podczas gdy LD nie różni się istotnie od LS (Rys. 2c). Wyniki te potwierdzają wszystkie cztery przewidywania hipotezy nieadaptacyjnej i są sprzeczne z przewidywaniami hipotezy adaptacyjnej, co silnie sugeruje, że przewaga edycji nonsynonimicznej w koleoidach jest wyjaśniona przez model harm-permitting i jest nieadaptacyjna. Rysunek 2c pokazuje, że chociaż LR jest znacząco wyższa niż LS w każdym coleoidzie, to jest niższa niż 2,5%. Można by zapytać, czy tak niskie mediany poziomów edycji naprawczej mogą być szkodliwe. Jak wspomniano, nie wszystkie edycje odtwórcze są koniecznie szkodliwe, co może wyjaśniać, dlaczego LR nie jest szczególnie wysoki. Niemniej jednak, Rys. 2c ujawnia większą frakcję redagowania restytucyjnego niż redagowania synonimicznego o znaczących poziomach redagowania. Na przykład, u kałamarnicy 33,37% i 13,31% miejsc edycji restoracyjnej, ale tylko 22,97% i 6,74% miejsc edycji synonimicznej ma poziomy edycji odpowiednio >5% i >20%. W zależności od szkodliwości mutacji G-to-A i względnej dominacji izoform A i G, te znaczące poziomy edycji A-to-G mogłyby znacząco zwiększyć prawdopodobieństwo utrwalenia mutacji G-to-A. Należy również zauważyć, że hipoteza dopuszczająca szkody jest proponowana jako alternatywa dla hipotezy adaptacyjnej. Jeżeli umiarkowane poziomy edycji nonsynonimicznej mogą być korzystne, jak twierdzi hipoteza adaptacyjna, nie ma powodu, dla którego nie mogłyby być szkodliwe. Co więcej, ogólny trend LR > LS i LD < LS wspiera hipotezę harm-permitting w stosunku do hipotezy adaptacyjnej.

Aby zbadać solidność naszych wyników, przeprowadziliśmy cztery dodatkowe analizy. Po pierwsze, odpowiednio zbadaliśmy miejsca edycji, które są specyficzne dla każdego z czterech coleoidów, ponieważ specyficzne dla gatunku zdarzenia edycyjne mają podobny wiek ewolucyjny, co pozwala na uczciwsze porównania. Uzyskane wyniki są bardzo podobne do tych z Rys. 2 i są odporne na potencjalne błędne identyfikacje edycji specyficznej dla danego gatunku (Supplementary Fig. 1). Po drugie, badaliśmy zdarzenia edycyjne zidentyfikowane z poszczególnych tkanek u bimaki. FR > FS i FD < FS utrzymują się we wszystkich tkankach, ale porównania poziomów edycji są w większości nieistotne, prawdopodobnie z powodu zmniejszonej mocy statystycznej w wyniku zmniejszonej wielkości próby (Tabela uzupełniająca 2). Po trzecie, ponieważ na poziom edycji sąsiadujących miejsc edycji może wpływać mutacja, co zmniejszyłoby moc statystyczną w porównywaniu synonimicznych i niesynonimicznych miejsc edycji, porównaliśmy synonimiczne miejsca edycji w jednej połowie zestawu genów z niesynonimicznymi miejscami edycji w drugiej połowie. Uszeregowaliśmy wszystkie geny według stosunku dN/dS między ortologami ośmiornicy i kałamarnicy i odpowiednio pogrupowaliśmy geny o nieparzystej randze w bin 1, a o parzystej w bin 2. Następnie porównaliśmy edycję synonimiczną w bin 1 z edycją nonsynonimiczną w bin 2, jak również edycję synonimiczną w bin 2 z edycją nonsynonimiczną w bin 1. Wyniki (Suplementary Fig. 2) są podobne do tych uzyskanych dla wszystkich miejsc edycji (Fig. 2). Po czwarte, zbadaliśmy odpowiednio FR/FS i FD/FS w pięciu przedziałach poziomu edycji (0-20%, 20-40%, 40-60%, 60-80% i 80-100%) w każdym z koleoidów (Supplementary Fig. 3). Zarówno FR/FS, jak i FD/FS generalnie wzrastają wraz z poziomem edycji. Chociaż FR/FS prawie zawsze przekracza 1, to FD/FS jest mniejsze od 1, z wyjątkiem sytuacji, gdy poziom edycji przekracza 60%. Należy podkreślić, że tylko kilka procent różnicujących miejsc edycyjnych w koleoidach mieści się w tym zakresie poziomów edycyjnych (Tabela 3), co sugeruje, że zdecydowana większość różnicujących miejsc edycyjnych jest nieadaptacyjna (szacunki ilościowe poniżej).

Przyspieszone nonsynonimiczne substytucje G-to-A

Model dopuszczający szkody przewiduje ponadto, że tempo nonsynonimicznej substytucji G-to-A w stosunku do tempa substytucji synonimicznej G-to-A (dN/dS dla G-to-A) powinno być podwyższone, ponieważ wysoka aktywność redakcyjna sprawia, że niektóre w przeciwnym razie szkodliwe nonsynonimiczne mutacje G-to-A są dopuszczalne. Ponadto wzrost ten powinien być szczególnie wyraźny w genach ulegających ekspresji wyłącznie w tkankach neuronalnych, a nie w genach nieulegających ekspresji w tkankach neuronalnych, ponieważ wysoka aktywność redagowania jest jak dotąd obserwowana tylko w tkankach neuronalnych25,27. Ponieważ jednak tylko bimak i kałamarnica mają dostępne dane sekwencjonowania RNA z kilku tkanek nieneuronalnych, a geny niewyrażone w tkankach neuronalnych nie występują w danych sekwencji transkryptów ośmiornicy i mątwy, a więc są wykluczone z naszych alignacji, musieliśmy zdefiniować dwie grupy genów o stosunkowo wysokiej i stosunkowo niskiej specyficzności w ekspresji neuronalnej, odpowiednio. Geny o wysokiej specyficzności ekspresji neuronalnej ulegają ekspresji wyłącznie w tkankach neuronalnych u bimaki lub kałamarnicy, natomiast te o niskiej specyficzności ekspresji neuronalnej ulegają ekspresji zarówno w tkankach neuronalnych, jak i nieneuronalnych zarówno u bimaki, jak i kałamarnicy. Model harm-permitting przewiduje, że dN/dS dla G-to-A jest większe dla genów o stosunkowo wysokiej neuronalnej specyficzności ekspresji niż dla tych o stosunkowo niskiej neutralnej specyficzności ekspresji. Ponieważ efekt pozwalający na uszkodzenie jest obecny tylko wtedy, gdy mutacja G do A w miejscu jest szkodliwa bez edycji, skoncentrowaliśmy się na miejscach nonsynonimicznych, które są zachowane w dwóch gatunkach outgroup (tj. nautilus, zając morski i bezpośrednio przodkujący węzeł gatunków ogniskowych dzielą ten sam stan przed edycją), aby zwiększyć czułość naszego testu. Co więcej, wzrost dN/dS powinien być specyficzny dla zmian G-to-A, ponieważ potencjalne szkody innych zmian, takich jak C/T-to-A i G-to-C/T nie mogą być złagodzone przez edycję A-to-G.

W tym celu rozważyliśmy wszystkie sześć gałęzi wywodzących się od wspólnego przodka czterech coleoidów. Obliczyliśmy dN i dS każdej z tych gałęzi, używając sekwencji przodków, a następnie obliczyliśmy dN/dS, dzieląc całkowite dN przez całkowite dS tych gałęzi. Na poparcie naszych przewidywań, dN/dS dla zmian G na A jest większe dla genów o stosunkowo wysokiej specyficzności ekspresji neuronalnej niż dla tych o stosunkowo niskiej specyficzności (Ryc. 3). Poprzez odpowiednie bootstrapowanie obu grup genów 200 razy stwierdziliśmy, że powyższa różnica jest statystycznie istotna (P = 0,015). Natomiast nie ma istotnej różnicy w dN/dS pomiędzy obiema grupami genów, gdy uwzględni się zmiany C/T na A lub G na C/T (Rys. 3). Warto zauważyć, że dN/dS < 1 we wszystkich przypadkach na ryc. 3, co jest zgodne z modelem harm-permitting, który nie obejmuje selekcji pozytywnej.

Ryc. 3

Coleoid nonsynonymous to synonymous substitution rate ratios (dN/dS) for various nucleotide changes. Wartość P jest oparta na 200 próbkach bootstrapowych; ns, nieistotne. Dane źródłowe są dostarczone jako plik Source Data.

Potencjalne korzyści ze wspólnej edycji wśród gatunków

Zasugerowano, że wspólna edycja wśród wielu gatunków jest prawdopodobnie korzystna, ponieważ w przeciwnym razie status edycji jest mało prawdopodobny, aby był ewolucyjnie konserwowany36. Potwierdzeniem tej tezy jest fakt, że nawet u ssaków, gdzie większość nonsynonimicznej edycji wydaje się neutralna lub szkodliwa, częstość miejsc konserwatywnych podlegających edycji nonsynonimicznej zarówno u ludzi, jak i u myszy znacznie przewyższa częstość miejsc konserwatywnych podlegających edycji synonimicznej u obu gatunków36. Podobne zjawisko zaobserwowano u muszki owocowej23. U koleoidów znaczna czę¶ć miejsc podlegaj±cych edycji nonsynonimicznej jest wspólna dla co najmniej dwóch gatunków, a miejsca silnie edytowane maj± tendencję do współdzielenia27. Aby zrozumieć potencjalne siły ewolucyjne utrzymujące edycję RNA w specyficznych miejscach w wielu coleoidach, przeanalizowaliśmy edycję wspólną dla kladu dwóch lub więcej gatunków.

Nonsynonimiczna edycja wspólna dla kladu gatunków, która modyfikuje stan aminokwasów z X do Y, jest uważana za odtwórczą, jeśli stan aminokwasów oparty na sekwencji genomowej to Y w każdym węźle drzewa, które jest przodkiem najnowszego wspólnego przodka kladu, lub różnicującą, jeśli Y nie jest obecne w żadnym z tych węzłów. W badaniu wspólnej edycji wzięliśmy pod uwagę średni poziom edycji w kladzie, w którym edycja jest wspólna. W przypadku miejsc wspólnej edycji między ośmiornicą i bimakiem oraz między kałamarnicą i mątwą, FR i FD są znacząco mniejsze niż FS (ryc. 4a). Z kolei LR i LD są istotnie większe od LS (ryc. 4b). Dla podzbioru powyższych wspólnych miejsc edycyjnych, które są wspólne dla wszystkich czterech koleoidów, FD i LD są odpowiednio istotnie większe niż FS (Rys. 4a) i LS (Rys. 4b), podobnie jak FR (Rys. 4a) i LR (Rys. 4b). Znacznie większy FD niż FS dla wspólnej redakcji może być spowodowany (i) selekcją pozytywną promującą początkową fiksację mutacji prowadzących do redakcji nonsynonimicznej i/lub (ii) selekcją oczyszczającą zapobiegającą utracie przypuszczalnie korzystnej redakcji nonsynonimicznej; jest to zatem wyraźny wskaźnik adaptacyjnej redakcji nonsynonimicznej. Znacznie większa LD niż LS dla wspólnej edycji może być spowodowana przez (i) selekcję pozytywną promującą wzrost poziomu edycji przypuszczalnie korzystnej edycji nonsynonimicznej, (ii) selekcję oczyszczającą zapobiegającą spadkowi poziomu edycji przypuszczalnie korzystnej edycji nonsynonimicznej, (iii) selekcja oczyszczająca preferencyjnie zapobiegająca utracie wysokiego poziomu edycji nonsynonimicznej, prawdopodobnie dlatego, że wysoki poziom edycji wiąże się z większymi korzyściami niż niski poziom edycji, i/lub (iv) selekcja pozytywna preferencyjnie promująca utratę niskiego poziomu edycji nonsynonimicznej, prawdopodobnie dlatego, że substytucja A do G jest preferowana w edytowanym miejscu, szczególnie gdy poziom edycji jest niski. Niezależnie od tego, znacząco większa LD w stosunku do LS również wskazuje na adaptacyjną edycję nonsynonimiczną. W związku z tym, redagowanie nonsynonimiczne wspólne dla wszystkich czterech koleoidów wykazuje silne i spójne sygnały adaptacyjne, co sugeruje, że duża część jest adaptacyjna. W porównaniu, nonsynonymous edycji wspólnej między ośmiornicy i bimac, i że wspólne między kałamarnicy i mątwy wykazują pewne, ale nie wszystkie oznaki adaptacji, a sygnały adaptacyjne są znacznie słabsze, sugerując, że tylko mniejsza część jest adaptive.

Jaka jest ogólna korzyść z wspólnej edycji, która pokazuje sygnały adaptacyjne? Istnieją dwie hipotezy. Po pierwsze, redagowanie może być korzystne z powodu tworzonej wewnątrzorganizmowej różnorodności białek25,27,32,42. Oznacza to, że edycja pozwala na istnienie w organizmie dwóch izoform białkowych na jedno edytowane miejsce, co może dawać wyższą kondycję, analogicznie do przewagi heterozygoty w miejscach polimorficznych. Alternatywnie, edycja oferuje nową izoformę, która może być po prostu sprawniejsza niż izoforma nieedytowana. W tej drugiej hipotezie korzyść z edycji jest porównywalna do korzyści z substytucji nukleotydów. Aby rozróżnić te dwie hipotezy, skoncentrowaliśmy się na miejscach, które są edytowane w co najmniej trzech z czterech coleoidów, ponieważ zgodnie z zasadą parsymonii edycja powinna istnieć w tych miejscach u wspólnego przodka czterech gatunków (Ryc. 2a). Następnie oszacowaliśmy częstość zastępowania redagowania substytucją A do G w którymkolwiek z czterech gatunków. Oczekuje się, że takie zastąpienie będzie mniej lub bardziej neutralne dla edycji synonimicznej. W przypadku edycji nonsynonimicznej, takie zastąpienie jest szkodliwe zgodnie z pierwszą hipotezą z powodu utraty różnorodności białek, ale jest neutralne zgodnie z drugą hipotezą. Stąd pierwsza hipoteza przewiduje niższą częstotliwość takich zamian dla edycji nonsynonimicznej niż synonimicznej, podczas gdy druga hipoteza przewiduje równą częstotliwość takich zamian dla edycji synonimicznej i nonsynonimicznej.

Co ciekawe, częstotliwość takich zamian dla edycji nonsynonimicznej jest znacząco większa niż dla edycji synonimicznej w dwuogonowym dokładnym teście Fishera (Rys. 4c i Tabela Uzupełniająca 4). Ponieważ to właśnie w przypadku edycji różnicującej, dla której natura korzyści jest kwestionowana, ograniczyliśmy analizę tylko do edycji różnicującej, ale uzyskaliśmy podobny wynik (Rys. 4c i Tabela 4). Warto zauważyć, że w tym zestawie miejsc nie znaleziono żadnej edycji synonimicznej lub nonsynonimicznej, która byłaby zastąpiona substytucją A do C/T (Tabela uzupełniająca 4). Nasze odkrycie sugeruje, że jeśli w ogóle, to jest bardziej prawdopodobne, że edycja nonsynonimiczna zostanie zastąpiona substytucją A na G niż edycja synonimiczna, prawdopodobnie dlatego, że posiadanie genomowego G jest lepsze niż posiadanie genomowego A, które nie może być zmienione na G we wszystkich cząsteczkach mRNA. Innymi słowy, nasze wyniki odrzucają pierwszą hipotezę i sugerują, że natura korzyści z adaptacyjnej edycji A do G jest podobna do tej z tej samej substytucji nukleotydowej, chociaż rozmiar korzyści z pierwszej jest mniejszy niż z drugiej. Co więcej, odkrycie na Rys. 4c sugeruje, że znacząco większa FD niż FS dla redagowania, wspólna dla wszystkich czterech kokoidów, jest lepiej wyjaśniona przez pozytywną selekcję promującą początkową fiksację mutacji, które doprowadziły do korzystnego redagowania nonsynonimicznego, niż selekcję oczyszczającą zapobiegającą utracie korzystnego redagowania nonsynonimicznego.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.