The preponderance of nonsynonymous A-to-I RNA editing in coleoids is nonadaptive

A nonadaptive hypothesis and its predictions

コーディング領域で現在Gによって占有されていてAを受容しないゲノム位置(図1a上段)を考えてみましょう。 その種の編集活性が高まるにつれて、その結果生じたAがmRNA分子の十分大きな割合でGに編集されれば、その部位でのGからAへの突然変異は中立的に固定されるかもしれない(図1aの中央の列を参照)。 GからAへの置換が起こると、mRNAレベルで許容されるのはAではなくGなので、その部位での高い編集レベルが選択的に維持されることになる。 上記の状況は非同義GからAへの置換と非同義AからGへの結合編集にのみ適用されるので、非同義編集部位の数と非同義編集レベルが対応する同義値に対して膨れ上がってしまうのである。 この場合、非同義語編集はG-to-A変異の固定化を可能にしたが、高度に編集されたゲノムAを持つ派生遺伝子型は、ゲノムGを持つ元の遺伝子型と適合性が変わらない。 我々は上記のシナリオで、編集レベルが非常に高く、そうでなければ劇的に変化するG-to-A突然変異が中立になることを仮定した。 しかし、編集レベルが十分でないために、G-to-A変異がわずかながら劇症化する可能性もある(図1aの下段参照)。 しかし、このような変異が固定化され、その後の進化で編集レベルが選択的に高くなる可能性もある。 このような場合でも、ゲノムGを持つ元の遺伝子型から、高度に編集されたゲノムAを持つ派生遺伝子型への正味の適応度向上はない。 RNA編集は有害な突然変異の固定化を可能にするので、上記の2つのシナリオを含む非適応型モデルを危害許容型と呼ぶことにする。 RNA編集によるharm-permittingの可能性は、特にオルガネラのトランスクリプトームの編集に関して何度も提案されているが、それがRNA編集の「適応的シグナル」の生成に完全に、あるいは主に関与しているという経験則は不足している。

Fig. 1

harm-permitモデルとharm-permit効果の検出戦略 a 非同義編集のharm-permit効果。 上段は、非同義A部位が編集されていない(あるいは編集レベルが低い)場合、その部位でのGからAへの突然変異は有害すぎて固定化されないことを示している。 中段は、その部位が高度に編集されている場合、G-to-A変異は中立となり、遺伝的ドリフトによって固定されることを示している。 そして、高い編集レベルは選択的に制約される。 下段は、サイトの編集レベルが中間の場合、G-to-A変異はわずかにdeleteriousであり、遺伝的ドリフトによって固定されることを示している。 編集レベルは正の選択によってさらに上昇する(あるいは負の選択によって維持される)可能性がある。 中段と下段では非同義語の編集レベルが比較的高いにもかかわらず、最終的な遺伝子型を元の遺伝子型と比較すると適応は起こっていない(つまり、フィットネスの純増加は起こっていない)。 DNAは青色で、RNAは赤色で示した。 b 修復編集は、アミノ酸置換によって失われた祖先のアミノ酸の状態を復元するもので、ここで示したような外側の枝で発生した場合と、それ以前の枝で発生した場合がある。 c 多様化編集は、編集前の状態とは異なるアミノ酸状態を、考慮された祖先の集合の中に作り出す。 ここでは1つの祖先の状態しか示していないが、複数の祖先の状態を考えてもよい。 bとcでは、XとYが異なるアミノ酸の状態を表し、矢印は編集の効果を示している。 8373>

コロイド神経組織では例外的に編集活性が高いことから25,27、非同義編集が多いという報告は、害を許容するモデルで説明でき非適応的であると仮定した。 この仮説を検証するために、非同義語編集を修復的と多様化の2つのカテゴリーに分けた41。 修復的編集はアミノ酸の状態を祖先の状態に戻すものであり(図1b)、多様化編集はアミノ酸の状態を祖先でない状態に変換するものである(図1c)。 修復的編集は害を許容する効果を与えることができるが、多様化編集はそうではないため、我々の仮説では、コレオイドで報告されている非同義語編集の優勢は修復的編集に起因し、多様化編集には起因しないと予測される。 特に、(i)編集される部位の頻度は同義語編集(FS)よりも修復的編集(FR)の方が高く、(ii)編集レベルの中央値は同義語編集(LS)よりも修復的編集(LR)の方が高いと予測する。 さらに、(iii)多様化(FD)は同義(FS)編集より編集される部位の頻度が高くなく、(iv)多様化(LD)は同義(LS)編集より編集レベルの中央値が高くないことを予測する。 一方、適応仮説はFRとLRについて具体的な予測はしていないが、FDとLDがそれぞれFSとLSより大きいという予測をしている。 注目すべきは、修復的編集のみが害を許容しうるが、すべての修復的編集が必ずしも害を許容するとは限らないことである。 例えば、GからAへの中立的な置換を復元する場合、復元編集は中立となる。

Patterns of restorative and diversifying editing

非適応仮説を検証するために、図2aに系統関係を示した6種の軟体動物27の公開された神経トランスクリプトームを解析した。 その中で、4つのコレオイドは神経組織でコーディングAtoG編集が広く行われているのに対し、2つのアウトグループは編集部位が大幅に少ない27。

これら6種で3587の1対1のオーソログ遺伝子を同定し、種樹のすべての内部ノードで祖先のコーディング配列を推定した(図2a)。 アミノ酸の状態をXからYに変更する樹木の外部ノードにおける非同義編集イベントは、焦点となる外部ノードに先祖返りした樹木のどのノードでも推定されるゲノム配列ベースのアミノ酸状態がYであれば修復的とみなし(図1b;方法論も参照)、焦点となる外部ノードに先祖返りしたどのノードにもYが存在しなければ多様化するとみなした(図1c)。 これらの定義はアミノ酸の状態に基づいており、非同義編集にのみ適用されていることは注目に値する。 同義語編集はおそらく中立なので、修復的編集と多様化編集に分ける必要はない。 さらに、同義語編集を2つのカテゴリーに分けると、同義語部位の祖先配列を推定する際の信頼性が低くなるため、精度が低下すると考えられる。 同義語以外の編集部位のうち,多様化編集部位の数は4つのコロイドにおいて修復的編集部位の8.4-13.9倍である(補足表1)

4つのコロイドにおいて,FRとLRはそれぞれFS(図2b),LS(図2c)より著しく大きな値を示した. 一方、FDはFSより有意に小さく(図2b)、LDはLSと有意な差はない(図2c)。 これらの結果は非適応仮説の4つの予測すべてを確認し、適応仮説の予測とは矛盾しており、コレオイドにおける非同義語編集の優位性は害悪許容モデルで説明され、非適応的であることが強く示唆された。 図2cは、各コロイドでLRがLSより有意に高いものの、2.5%より低いことを示している。 このような低い中央値の修復編集が害を許容するものであるのか、という疑問が生じるかもしれない。 前述したように、すべての修復的編集が必ずしも有害であるとは限らないので、LRが特に高くないのはこのためかもしれない。 しかし、図2cに示すように、同義語編集よりも修復的編集の割合が多く、編集レベルも高いことがわかる。 例えば、イカでは修復的編集部位の33.37%と13.31%が、同義的編集部位の22.97%と6.74%だけが、それぞれ編集レベル>5%と>20%である。 G-to-A変異の害とAおよびGアイソフォームの相対的な優位性にもよるが、これらの有意なレベルのA-to-G編集はG-to-A変異の固定化確率を大幅に増加させる可能性がある。 また、適応的仮説に代わるものとして、害を許容する仮説が提案されていることにも注目したい。 適応仮説が主張するように、適度なレベルの非同義語編集が有益であるならば、害を許容しない理由はないだろう。 さらに、LR > LSとLD < LSの一般的な傾向は、適応仮説と比較して害を許す仮説を支持している。

我々の結果の頑健性を調べるために、4つの追加分析を行った。 まず、種特異的な編集イベントは進化年代が似ており、より公平な比較が可能であるため、4つのコレオイドに特異的な編集部位をそれぞれ調べた。 得られた結果は図2の結果と非常によく似ており、種特異的な編集の誤認の可能性に対してもロバストであった(補足図1)。 次に、バイマックの個々の組織から同定された編集事象についてプローブした。 FR > FSとFD < FSは組織間でも保持されるが、編集レベルの比較はほとんど有意ではなく、これはサンプルサイズが小さくなった結果、統計的検出力が低下したためと思われる(補足表2)。 第三に、隣接する編集部位の編集レベルは変異によって影響を受ける可能性があり、同義語と非同義語の編集部位を比較する際の統計的検出力が低下するため、遺伝子セットの半分で同義語編集部位ともう半分で非同義語編集部位を比較した。 具体的には、すべての遺伝子をタコとイカのオーソログのdN/dS比によってランク付けし、それぞれ奇数ランクの遺伝子をbin 1に、偶数ランクの遺伝子をbin 2に分類し、bin 1の同義編集とbin 2の非同義編集、およびbin 2の同義編集とbin 1の非同義編集を比較した。 その結果(補足図2)、すべての編集部位の結果と同様なことがわかった(図2)。 第四に、各コレノイドの5つの編集レベル範囲(0-20%, 20-40%, 40-60%, 60-80%, 80-100%)でFR/FSとFD/FSをそれぞれ調べた(Supplementary Fig.3)。 FR/FS、FD/FSともに、編集レベルが上がるにつれて、概ね増加する。 FR/FSはほぼ常に1を超えるが、FD/FSは編集レベルが60%以上の場合を除き、1より小さい。 ここで重要なことは、多様化する編集部位のうちこの編集レベルの範囲に入るのは数%であり(補足表3)、多様化する編集の大部分は非適応的であることを示唆している(定量的推定は下記参照)。

Accelerated nonsynonymous G-to-A substitutions

害を許すモデルはさらに、高い編集活性により、そうでなければ有害な非同義GtoA変異を許容するため、同義GtoA置換に対する非同義GtoA置換率(GtoAに対するdN/DS)が上昇するはずだと予測する。 さらに、高い編集活性はこれまでのところ神経組織でのみ観察されるため、この上昇は神経組織でのみ発現する遺伝子で特に顕著になり、神経組織で発現しない遺伝子では見られないはずである25,27。 しかし、神経以外のいくつかの組織のRNA-シーケンスデータが利用できるのはバイマックとイカだけであり、神経組織で発現していない遺伝子はタコとイカの転写配列データにはなく、したがってアラインメントから除外されるため、神経発現の特異性が比較的高い遺伝子グループと比較的低い遺伝子グループをそれぞれ定義せざるを得ませんでした。 神経発現特異性の高い遺伝子はバイマックやイカの神経組織でのみ発現しており、神経発現特異性の低い遺伝子はバイマックとイカの両方で神経組織と非神経組織の両方で発現していることが確認された。 害を許すモデルは、神経発現特異性が相対的に高い遺伝子の方が、中性発現特異性が相対的に低い遺伝子よりも、GtoAのdN/dSが大きくなることを予測するものである。 害を許す効果は、ある部位でのG-to-A変異が編集なしで劇的に変化する場合にのみ存在するため、我々はテストの感度を上げるために、2つのアウトグループ種で保存されている非同義部位(すなわち、オウムガイ、海ウサギ、対象種のすぐ祖先のノードが編集前の状態を共有している)に焦点を当てた。 さらに、C/TからA、GからC/Tといった他の変化の潜在的な害はAからGへの編集では軽減できないので、dN/dSの上昇はGからAへの変化に特化すべきである。

この目的のために、4つのコレオロイドの共通祖先から派生する6つの枝すべてを検討した。 現存する祖先配列と推定される祖先配列を用いて、これらの枝のそれぞれのdNとdSを計算し、これらの枝の合計dNを合計dSで割って、dN/dSを計算した。 その結果、GからAへの変化に対するdN/dSは、神経発現特異性が比較的高い遺伝子ほど、特異性が比較的低い遺伝子よりも大きくなることがわかった(図3)。 2つの遺伝子群をそれぞれ200回ブートストラップすることで、上記の差は統計的に有意であることがわかった(P = 0.015)。 一方、C/TからAへの変化、GからC/Tへの変化を考慮した場合、2つの遺伝子グループの間にdN/dSの有意な差は存在しない(図3)。 図3ではすべてのケースでdN/dS < 1となっており、正の選択を伴わない危害許容モデルと一致していることは注目に値する。

Fig. 3

Coleoid nonsynonymous to synonymous substitution rate ratios (dN/dS) for various nucleotide changes.(図3参照)。 P値は200ブートストラップサンプルに基づく;nsは有意でない。 ソースデータはSource Dataファイルとして提供されている。

The potential benefit of shared editing among species

複数の種間で編集を共有することは、そうでなければ編集状態が進化的に保存される可能性が低いため、有益であると考えられることが示唆されている36。 この提案を支持するものとして、ほとんどの非同義語編集が中立または劇的に見える哺乳類においてさえ、ヒトとマウスの両種では非同義語編集を受ける保存部位の頻度が同義語編集を受ける保存部位の頻度を著しく上回るという知見が得られた36。 同様の現象はミバエでも報告されている23。 コレオイドでは、非同義編集のかなりの部分が少なくとも2つの種で共有されており、高度に編集された部位は共有される傾向にある27。 8373>

アミノ酸の状態をXからYに変更する、ある種のクレードが共有する非同義編集イベントは、ゲノム配列に基づいて推定されるアミノ酸の状態が、そのクレードの最も最近の共通祖先に先祖返りした木のどのノードでもYであれば修復的、これらの祖先のどのノードにもYが存在しなければ多様化したと見なされる。 共有編集の研究では、編集が共有されているクレードの平均編集レベルを考慮した。 タコとバイマック、イカとイカの間で共有されている編集部位については、FRとFDはともにFSより有意に小さい(図4a)。 一方、LRとLDはいずれもLSより有意に大きい(Fig.4b)。 上記の共有編集部位のうち、4つのコロイドすべてに共有されている部分集合については、FDとLDはそれぞれFS(図4a)とLS(図4b)より有意に大きく、FR(図4a)とLR(図4b)も同様である。 共有編集のFDがFSより有意に大きいのは、(i)非同義編集につながる突然変異の初期固定化を促進する正の選択、および(ii)おそらく有益な非同義編集の損失を防ぐ純化選択によるものと考えられ、適応的非同義編集の明確な指標となる。 共有編集のLDがLSより有意に大きい場合、(i)正選択により有益と思われる非同義語編集の編集レベルの増加が促進される、(ii)浄化選択により有益と思われる非同義語編集の編集レベルの減少が防止される、などの原因が考えられる。 (iii)高レベルの非同義語編集の喪失を優先的に防ぐ純化選択、おそらく編集レベルが高い方が低いよりも大きな利益につながるため、および/または、(iv)低レベルの非同義語編集の喪失を優先的に促す正の選択、おそらく編集レベルが低い場合は特に、編集部位ではA-G置換が好まれるためである。 しかし、LSより有意に大きいLDは非同義語の編集が適応的であることを示す。 したがって、4つのコロイドに共通する非同義語の編集は強く一貫した適応的なシグナルを示し、大きな割合が適応的であることが示唆される。 それに比べ、タコとバイマック、イカとコウイカの間で共有されている非同義語編集は、適応の兆候を示すが全てではなく、適応シグナルは非常に弱く、より小さな割合しか適応的でないことが示唆された。 二つの仮説が存在する。 第一に、編集は生物内タンパク質の多様性を生み出すため有益である可能性がある25,27,32,42。 すなわち、編集によって、ある生物では編集部位ごとに2つのタンパク質アイソフォームが存在することになり、多型部位におけるヘテロ接合体の優位性と類似して、より高いフィットネスを与える可能性がある。 あるいは、編集によって新しいアイソフォームが得られ、それが編集されていないアイソフォームよりも単に適合性が高いのかもしれない。 この場合、編集の利点はヌクレオチド置換の利点に匹敵する。 この2つの仮説を区別するために、4種のコロイドのうち少なくとも3種で編集されている部位に注目した。なぜなら、パーシモン原理により、4種の共通祖先ではこれらの部位に編集が存在したはずだからである(図2a)。 次に、4種のいずれにおいても、編集がAからGへの置換に置き換わる頻度を推定した。 このような置換は、同義語編集の場合、多かれ少なかれ中立であると予想される。 非同義編集の場合、このような置換はタンパク質の多様性が失われるため、第一仮説の下では劇的に変化するが、第二仮説の下では中立的である。 したがって、第一仮説では非同義編集の方が同義編集よりもそのような置換の頻度が低く、第二仮説では同義編集と非同義編集の置換の頻度が等しいと予測される。

興味深いことに、両側フィッシャーの正確検定では非同義編集の置換頻度は同義編集のそれより著しく大きい(図4cおよび補足表4)。 有益性の性質が問題となるのは共有の多様化編集であるため、多様化編集のみに限定して解析を行ったが、同様の結果が得られた(図4cおよび補足表4)。 注目すべきは、この一連の部位の中で、AからC/Tへの置換が行われた同義語・非同義語の編集は見つからなかったことである(補足表4)。 この結果は、むしろ非同義編集の方が同義編集よりもA-G置換されやすいことを示唆している。おそらく、すべてのmRNA分子でGに編集されないゲノムAを持つよりも、ゲノムGを持つ方が優れているためであろう。 つまり、我々の結果は最初の仮説を否定し、適応的なA-to-G編集の利益の性質は、同じヌクレオチド置換のそれと似ているが、前者からの利益の大きさは後者からのそれよりも小さいことが示唆された。 さらに、図4cの発見は、4つのコロイドに共通する編集のためのFSよりも有意に大きなFDは、有益な非同義編集の損失を防ぐ純化選択よりも有益な非同義編集につながる突然変異の最初の固定化を促進する正選択によってよりよく説明されることを示唆した

コメントを残す

メールアドレスが公開されることはありません。