O ipoteză neadaptivă și predicțiile sale
Să luăm în considerare o poziție genomică într-o regiune codificatoare care este în prezent ocupată de G și nu acceptă A (a se vedea rândul de sus din Fig. 1a). Pe măsură ce activitatea de editare în cadrul speciei crește, o mutație de la G la A în acest loc poate deveni neutră și fixă dacă A rezultat este editat înapoi la G într-o proporție suficient de mare de molecule de ARNm (a se vedea rândul din mijloc din Fig. 1a). În urma substituției de la G la A, nivelul ridicat de editare la nivelul situsului va fi menținut în mod selectiv, deoarece G și nu A este permis la nivelul ARNm. Deoarece situația de mai sus se aplică numai la substituțiile nonsinonime de la G la A și la editarea nonsinonimă cuplată de la A la G, aceasta umflă numărul de site-uri de editare nonsinonime și nivelurile de editare nonsinonime în raport cu valorile sinonime corespunzătoare. Cu toate că, în acest caz, editarea nesinonimă a permis fixarea mutației G la A, care altfel ar fi fost dăunătoare, genotipul derivat cu un A genomic foarte editat nu este mai potrivit decât genotipul original cu un G genomic. În scenariul de mai sus, am presupus că nivelul de editare este atât de ridicat încât mutația G-în-A, altfel dăunătoare, devine neutră. Este, de asemenea, posibil ca nivelul de editare să nu fie suficient de ridicat, ceea ce face ca mutația de la G la A să fie ușor dăunătoare (a se vedea rândul de jos din Fig. 1a). Cu toate acestea, o mutație ușor dăunătoare poate fi totuși fixată, iar nivelul de editare poate fi crescut în mod selectiv în evoluția ulterioară. Chiar și în acest scenariu, nu există un câștig net de fitness de la genotipul original cu un genom G genomic la genotipul derivat cu un genom A genomic care este foarte editat. Ne referim la modelul neadaptativ de mai sus, care include ambele scenarii descrise, ca la modelul de permisiune a daunelor, deoarece editarea ARN permite fixarea unor mutații care altfel ar fi dăunătoare. Deși posibilitatea permiterii daunelor prin editarea ARN a fost propusă de mai multe ori31,38,39,40, în special în ceea ce privește editarea transcriptomilor organitelor, lipsesc dovezile empirice care să demonstreze că aceasta este în întregime sau în principal responsabilă pentru crearea „semnalelor adaptative” de editare a ARN.
Datorită activității excepțional de ridicate de editare în țesuturile neuronale coleoide25,27, emitem ipoteza că preponderența raportată a editării nesinonime se explică prin modelul harm-permitting și este neadaptivă. Pentru a testa această ipoteză, împărțim editarea nesinonimă în două categorii: restauratoare și diversificatoare41. Editarea restaurativă convertește starea aminoacidului înapoi la o stare ancestrală (Fig. 1b), în timp ce editarea diversificatoare convertește starea aminoacidului la o stare neancestrală (Fig. 1c). Deoarece editarea restaurativă, dar nu și cea diversificatoare, poate conferi un efect de permisiune a daunelor, ipoteza noastră prezice că preponderența raportată a editării nesinonime în coleoizi se poate atribui editării restaurative, dar nu celei diversificatoare. În special, prezicem că (i) frecvența site-urilor editate este mai mare pentru editarea restaurativă (FR) decât pentru cea sinonimă (FS) și că (ii) nivelul median de editare este mai mare pentru editarea restaurativă (LR) decât pentru cea sinonimă (LS). De asemenea, prezice că (iii) frecvența site-urilor editate nu este mai mare în cazul editării diversificatoare (FD) decât în cazul editării sinonime (FS) și că (iv) nivelul median de editare nu este mai mare în cazul editării diversificatoare (LD) decât în cazul editării sinonime (LS). În schimb, ipoteza adaptivă nu are predicții specifice cu privire la FR și LR, dar prezice că FD și LD sunt mai mari decât FS și, respectiv, LS. Este demn de remarcat faptul că, deși numai editarea restaurativă poate fi permisivă, nu toată editarea restaurativă este neapărat permisivă. De exemplu, editarea restaurativă ar fi neutră dacă restaurează o substituție neutră de la G la A.
Patroni de editare restaurativă și diversificatoare
Pentru a testa ipoteza neadaptivă, am analizat transcriptomii neuronali publicați a șase specii de moluște27, ale căror relații filogenetice sunt reprezentate în Fig. 2a. Dintre acestea, cele patru coleoide au o editare A-to-G de codificare larg răspândită în țesuturile neuronale, în timp ce cele două grupuri externe au substanțial mai puține situsuri de editare27.
Am identificat 3587 de gene ortologe unu-la-unu în aceste șase specii și am dedus secvențe de codificare ancestrale la toate nodurile interioare ale arborelui speciilor (Fig. 2a). Am considerat un eveniment de editare nesinonimă într-un nod exterior al arborelui care modifică starea aminoacizilor de la X la Y ca fiind reparator dacă starea aminoacizilor bazată pe secvența genomică dedusă este Y în orice nod al arborelui care este strămoșul nodului exterior focal (Fig. 1b; a se vedea, de asemenea, secțiunea Metode), sau diversificator dacă Y nu este prezent în niciun nod al arborelui care este strămoșul nodului exterior focal (Fig. 1c). Este demn de remarcat faptul că aceste definiții se bazează pe stările de aminoacizi și se aplică numai la editarea nesinonimă. Editarea sinonimică este probabil neutră, deci nu este necesar să fie separată în editare restauratoare și editare diversificatoare. În plus, separarea editării sinonime în cele două categorii ar fi mai puțin precisă din cauza fiabilității mai scăzute în ceea ce privește deducerea secvențelor ancestrale în locurile sinonime. Dintre cele două categorii de situsuri de editare nesinonimă, numărul situsurilor de editare diversificatoare este de 8,4-13,9 ori mai mare decât cel al situsurilor de editare restauratoare în cele patru coleoide (tabelul suplimentar 1).
În fiecare dintre cele patru coleoide, FR și LR sunt semnificativ mai mari decât FS (Fig. 2b) și, respectiv, LS (Fig. 2c). În schimb, FD este semnificativ mai mică decât FS (Fig. 2b), în timp ce LD nu este semnificativ diferită de LS (Fig. 2c). Aceste rezultate confirmă toate cele patru predicții ale ipotezei neadaptative și sunt în dezacord cu predicțiile ipotezei adaptative, sugerând cu tărie că preponderența editării nesinonime în coleoizi este explicată de modelul de permisiune a daunelor și este neadaptativă. Figura 2c arată că, deși LR este semnificativ mai mare decât LS în fiecare coleoid, este mai mică de 2,5%. S-ar putea întreba dacă astfel de niveluri mediane scăzute de editare restaurativă pot fi harm-permitting. După cum s-a menționat, nu toată editarea restaurativă este neapărat permisivă, ceea ce ar putea explica de ce LR nu este deosebit de ridicată. Cu toate acestea, Fig. 2c relevă o fracțiune mai mare de editare restaurativă decât de editare sinonimică cu niveluri de editare apreciabile. De exemplu, la calamar, 33,37% și 13,31% din site-urile de editare restaurativă, dar numai 22,97% și 6,74% din site-urile de editare sinonimică au niveluri de editare >5% și, respectiv, >20%. În funcție de nocivitatea mutației de la G la A și de dominanța relativă a izoformelor A și G, aceste niveluri apreciabile de editare de la A la G ar putea crește substanțial probabilitatea de fixare a mutației de la G la A. De asemenea, ar trebui remarcat faptul că ipoteza permiterii daunelor este propusă ca o alternativă la ipoteza adaptivă. În cazul în care nivelurile moderate de editare nesinonimă ar putea fi benefice, așa cum susține ipoteza adaptivă, nu există niciun motiv pentru care acestea nu ar putea fi dăunătoare. Mai mult decât atât, tendința generală a LR > LS și LD < LS susține ipoteza harm-permitting în raport cu ipoteza adaptivă.
Pentru a examina robustețea rezultatelor noastre, am efectuat patru analize suplimentare. În primul rând, am examinat, respectiv, locurile de editare care sunt specifice fiecăruia dintre cele patru coleoizi, deoarece evenimentele de editare specifice speciilor au vârste evolutive similare, permițând comparații mai echitabile. Rezultatele obținute sunt foarte asemănătoare cu cele din Fig. 2 și sunt robuste la eventualele identificări eronate ale editării specifice speciilor (Fig. suplimentară 1). În al doilea rând, am sondat evenimentele de editare identificate din țesuturi individuale la bimac. FR > FS și FD < FS se mențin în toate țesuturile, dar comparațiile la nivel de editare sunt în cea mai mare parte nesemnificative, probabil din cauza puterii statistice reduse ca urmare a dimensiunilor reduse ale eșantioanelor (tabelul suplimentar 2). În al treilea rând, deoarece nivelurile de editare ale site-urilor de editare vecine pot fi coafectate de o mutație, ceea ce ar reduce puterea statistică în compararea site-urilor de editare sinonime cu site-urile de editare nesinonime, am comparat site-urile de editare sinonime dintr-o jumătate a setului de gene cu site-urile de editare nesinonime din cealaltă jumătate. Mai exact, am clasificat toate genele în funcție de raportul dN/dS între ortologii caracatiței și ai calmarului și, respectiv, am grupat genele cu ranguri impare în bin 1 și cele cu ranguri pare în bin 2. Apoi am comparat editarea sinonimă din bin 1 cu editarea nesinonimă din bin 2, precum și editarea sinonimă din bin 2 cu editarea nesinonimă din bin 1. Rezultatele (Fig. suplimentară 2) sunt similare cu cele obținute pentru toate site-urile de editare (Fig. 2). În al patrulea rând, am investigat FR/FS și, respectiv, FD/FS în cinci intervale de nivel de editare (0-20%, 20-40%, 40-60%, 60-80% și 80-100%) în fiecare coleoid (Fig. Suplimentară 3). Atât FR/FS, cât și FD/FS cresc, în general, odată cu nivelul de editare. Deși FR/FS depășește aproape întotdeauna 1, FD/FS este mai mică decât 1, cu excepția cazului în care nivelul de editare depășește 60%. Este important de subliniat faptul că doar câteva procente din site-urile de editare diversificatoare dintr-un coleoid se încadrează în acest interval de nivel de editare (tabelul suplimentar 3), ceea ce sugerează că marea majoritate a editării diversificatoare este neadaptivă (a se vedea mai jos pentru estimări cantitative).
Substituții nonsinonime G-to-A accelerate
Modelul de permisiune a daunelor prezice, de asemenea, că rata de substituție nonsinonimă G-to-A în raport cu cea de substituție sinonimă G-to-A (dN/dS pentru G-to-A) ar trebui să fie ridicată, deoarece activitatea ridicată de editare face ca unele mutații nonsinonime G-to-A, altfel dăunătoare, să fie acceptabile. În plus, această creștere ar trebui să fie deosebit de pronunțată în genele exprimate exclusiv în țesuturile neuronale, dar nu și în genele neexprimate în țesuturile neuronale, deoarece activitatea de editare ridicată este observată până în prezent numai în țesuturile neuronale25,27. Cu toate acestea, deoarece numai bimacul și calmarul dispun de date disponibile de secvențiere ARN din mai multe țesuturi neuronale și deoarece genele neexprimate în țesuturile neuronale nu se regăsesc în datele de secvență de transcriere ale caracatiței și ale sepie și, prin urmare, sunt excluse din alinierile noastre, a trebuit să definim două grupuri de gene cu specificitate relativ ridicată și, respectiv, relativ scăzută în expresia neuronală. Genele cu specificități ridicate de expresie neuronală sunt exprimate exclusiv în țesuturile neuronale la bimac sau calmar, în timp ce cele cu specificități scăzute de expresie neuronală sunt exprimate atât în țesuturile neuronale, cât și în cele neuronale, atât la bimac, cât și la calmar. Modelul de permisiune a daunelor prezice că dN/dS pentru G-to-A este mai mare pentru genele cu specificități de expresie neuronală relativ ridicate decât pentru cele cu specificități de expresie neutră relativ scăzute. Deoarece efectul harm-permitting este prezent numai atunci când o mutație G-to-A la un sit este dăunătoare fără editare, ne-am concentrat asupra siturilor nesinonime care sunt conservate în cele două specii de outgroup (adică, nautilus, iepure de mare și nodul imediat ancestral al speciei focale împărtășesc aceeași stare de pre-editare) pentru a crește sensibilitatea testului nostru. Mai mult decât atât, creșterea dN/dS ar trebui să fie specifică modificărilor de la G la A, deoarece potențialele prejudicii ale altor modificări, cum ar fi C/T la A și G la C/T, nu pot fi atenuate prin editarea de la A la G.
În acest scop, am luat în considerare toate cele șase ramuri care descind din strămoșul comun al celor patru coleoizi. Am calculat dN și dS ale fiecăreia dintre aceste ramuri folosind secvențele ancestrale existente și deduse, iar apoi am calculat dN/dS prin împărțirea dN total la dS total al acestor ramuri. În sprijinul predicției noastre, dN/dS pentru schimbările de la G la A este mai mare pentru genele cu specificități de expresie neuronală relativ ridicate decât pentru cele cu specificități relativ scăzute (Fig. 3). Prin bootstraparea respectiv a celor două grupuri de gene de 200 de ori, am constatat că diferența de mai sus este semnificativă din punct de vedere statistic (P = 0,015). În schimb, nu există nicio diferență semnificativă în ceea ce privește dN/dS între cele două grupuri de gene atunci când sunt luate în considerare schimbările de la C/T la A sau de la G la C/T (Fig. 3). Este demn de remarcat faptul că dN/dS < 1 în toate cazurile din Fig. 3, în concordanță cu modelul de permisiune a daunelor care nu implică selecția pozitivă.
Beneficiul potențial al editării comune între specii
S-a sugerat că editarea comună între mai multe specii este probabil benefică, deoarece, în caz contrar, este puțin probabil ca starea de editare să fie conservată din punct de vedere evolutiv36. În sprijinul acestei sugestii a venit constatarea că, chiar și la mamifere, unde majoritatea editării nesinonime pare neutră sau dăunătoare, frecvența situsurilor conservate supuse editării nesinonime, atât la om, cât și la șoarece, depășește în mod semnificativ frecvența situsurilor conservate supuse editării sinonime la ambele specii36. Un fenomen similar a fost raportat la muștele de fructe23. La coleoizi, o fracțiune considerabilă de editare nesinonimă este împărtășită de cel puțin două specii, iar site-urile puternic editate au tendința de a fi partajate27. Pentru a înțelege forțele evolutive potențiale care mențin editarea ARN în situri specifice în mai multe coleoide, am analizat editarea partajată de o cladă de două sau mai multe specii.
Un eveniment de editare nesinonimă partajat de o cladă de specii care modifică starea aminoacidului de la X la Y este considerat restaurator dacă starea aminoacidului dedusă pe baza secvenței genomice este Y în orice nod al arborelui care este ancestral față de cel mai recent strămoș comun al cladei, sau diversificator dacă Y nu este prezent în niciunul dintre aceste noduri ancestrale. În studiul editării partajate, am luat în considerare nivelul mediu de editare în clada în care editarea este partajată. Pentru site-urile de editare partajate între caracatiță și bimac, precum și cele partajate între calmar și sepie, FR și FD sunt ambele semnificativ mai mici decât FS (Fig. 4a). În schimb, LR și LD sunt ambele semnificativ mai mari decât LS (Fig. 4b). Pentru subansamblul de site-uri de editare comune de mai sus care sunt partajate de toate cele patru coleoide, FD și LD sunt semnificativ mai mari decât FS (Fig. 4a) și, respectiv, LS (Fig. 4b), la fel ca FR (Fig. 4a) și LR (Fig. 4b). Un FD semnificativ mai mare decât FS pentru editarea partajată ar putea fi cauzat de (i) selecția pozitivă care promovează fixarea inițială a mutațiilor care duc la editarea nesinonimă și/sau (ii) selecția purificatoare care împiedică pierderea editării nesinonime prezumtiv benefice; prin urmare, este un indicator clar al editării nesinonime adaptative. Un LD semnificativ mai mare decât LS pentru editarea partajată ar putea fi cauzat de (i) selecția pozitivă care promovează creșterea nivelurilor de editare a editării nesinonime presupus benefice, (ii) selecția purificatoare care împiedică scăderea nivelurilor de editare a editării nesinonime presupus benefice, (iii) o selecție purificatoare care previne în mod preferențial pierderea editării nonsinonime de nivel înalt, probabil pentru că nivelurile înalte de editare sunt asociate cu beneficii mai mari decât nivelurile scăzute de editare, și/sau (iv) o selecție pozitivă care promovează în mod preferențial pierderea editării nonsinonime de nivel scăzut, probabil pentru că o substituție de la A la G este favorizată la un sit editat, în special atunci când nivelul de editare este scăzut. În orice caz, un LD semnificativ mai mare decât LS indică, de asemenea, o editare adaptivă nesinonimă. Prin urmare, editarea nesinonimă împărtășită de toate cele patru coleoide prezintă semnale adaptative puternice și consecvente, sugerând că o mare parte este adaptivă. În comparație, editarea nesinonimă partajată între caracatiță și bimac și cea partajată între calmar și sepie prezintă unele, dar nu toate semnele de adaptare, iar semnalele adaptive sunt mult mai slabe, sugerând că doar o fracțiune mai mică este adaptivă.
Care este beneficiul general al editării partajate care prezintă semnale adaptive? Există două ipoteze. În primul rând, editarea poate fi benefică din cauza diversității proteice create în interiorul organismului25,27,32,42. Altfel spus, editarea permite existența a două izoforme proteice per sit editat într-un organism, ceea ce poate conferi o fitness mai mare, analog cu avantajul heterozigotului la siturile polimorfe. Alternativ, editarea oferă o nouă izoformă care poate fi pur și simplu mai potrivită decât izoforma needitată. În această ultimă ipoteză, beneficiul editării este comparabil cu cel al unei substituiri de nucleotide. Pentru a face distincția între aceste două ipoteze, ne-am concentrat asupra situsurilor care sunt editate în cel puțin trei dintre cele patru coleoizi, deoarece editarea ar fi trebuit să existe în aceste situsuri în strămoșul comun al celor patru specii, conform principiului parsimoniei (Fig. 2a). Am estimat apoi frecvența de înlocuire a editării cu o substituție de la A la G în oricare dintre cele patru specii. Se așteaptă ca astfel de înlocuiri să fie mai mult sau mai puțin neutre pentru editarea sinonimică. Pentru editarea nesinonimă, astfel de înlocuiri sunt dăunătoare în cadrul primei ipoteze din cauza pierderii diversității proteinelor, dar sunt neutre în cadrul celei de-a doua ipoteze. Prin urmare, prima ipoteză prezice o frecvență mai mică a unor astfel de înlocuiri pentru editarea nesinonimă decât pentru editarea sinonimă, în timp ce a doua ipoteză prezice frecvențe egale ale unor astfel de înlocuiri pentru editarea sinonimă și nesinonimă.
Interesant este faptul că frecvența unor astfel de înlocuiri pentru editarea nesinonimă este semnificativ mai mare decât cea pentru editarea sinonimă într-un test Fisher exact cu două cozi (Fig. 4c și tabelul suplimentar 4). Deoarece editarea diversificatoare comună este cea pentru care se pune în discuție natura beneficiului, am restrâns analiza doar la editarea diversificatoare, dar am obținut un rezultat similar (Fig. 4c și Tabelul suplimentar 4). Este demn de remarcat faptul că nu s-a constatat că nicio editare sinonimă sau nonsinonimă nu a fost înlocuită cu o substituție de la A la C/T în cadrul acestui set de situri (tabelul suplimentar 4). Constatarea noastră sugerează că, în orice caz, este mai probabil ca editarea nesinonimă să fie înlocuită cu o substituție de la A la G decât editarea sinonimă, probabil pentru că a avea un G genomic este superior la a avea un A genomic care nu poate fi editat în G în toate moleculele de ARNm. Cu alte cuvinte, rezultatele noastre resping prima ipoteză și sugerează că natura beneficiului editării adaptive de la A la G este similară cu cea a aceleiași substituții nucleotidice, deși mărimea beneficiului din prima ipoteză este mai mică decât cea din cea de-a doua. Mai mult, constatarea din Fig. 4c sugerează că FD semnificativ mai mare decât FS pentru editare, împărtășită de toate cele patru coleoide, se explică mai bine prin selecția pozitivă care promovează fixarea inițială a mutațiilor care au dus la editarea nesinonimă benefică decât prin selecția purificatoare care împiedică pierderea editării nesinonime benefice.
.