谷学発!常識と非常識 第65話 生命の起源と進化:ウイルスの話② ―ヒトゲノムはウイルスでいっぱい?

1.ヒトゲノムの内訳
ヒトのゲノム解析は驚くべきことを2つ明らかにしました。1つはヒト遺伝子をコードするDNAが全ゲノムのわずか1%しかないことです(※1)。もう1つは、ヒトゲノムの約70%は機能がよく分かっておらず、しかもその大部分がウイルス遺伝子かもしれないことです。下図(文献2より引用)は、ヒトゲノムの内訳を示します。約30%が広義の「遺伝子領域」、残り70%が「非遺伝子領域」です。

2.「遺伝子領域」(30%)の内訳
「遺伝子領域」は「コード領域」(3%)と、「非コード領域」(27%)に分けられます。「コード領域」は、「タンパク質コード領域」(1%)と、「RNAコード領域」(2%)に分けられます。前者は約21,000個のヒト遺伝子をコードし、後者はそれら遺伝子の発現(タンパク質合成)に必要な転移RNA(tRNA)とリボソームRNA(rRNA)をコードしています。一方「非コード領域」には、「転写調節領域」(2%)と、イントロン(25%)が含まれます(※2)。「転写調節領域」は各遺伝子の直前にあって、「転写因子」が作用する部位です。「転写因子」とは遺伝子発現のタイミングや遺伝子活性を調節するタンバク質類をいいます。一方イントロンは、タンパク質をコードするエクソンとエクソンの間をつないでおり、1つの遺伝子に通常複数含まれています。イントロンはDNAから転写された直後のメッセンジャーRNA(mRNA)の前駆体には含まれますが、その後切り取られ(スプライシングという)、完成したmRNAには含まれません。ヒトの遺伝子の70%以上が1つの遺伝子から複数種類のタンパク質を産生していますが、その機構はイントロンの選択的スプライシングにより複数種類のmRNAが産生されるからです(※3)。

3.「非遺伝子領域」(70%)の内訳
「非遺伝子領域」は、機能不明な雑多な領域を含むため、ジャンク(がらくた)DNAと呼ばれてきましたが、最近、その一部が重要な機能をもつことが分かってきました。この領域に含まれる主な要素は、トランスポゾン(第4項参照)、内在化したレトロウイルス(第5項参照)、機能を失った遺伝子をいう「偽遺伝子」、凝縮した不活性なDNA領域をいうヘテロクロマチン、染色体に散在する反復配列【SINE(短分散型核因子)やLINE(長分散型核因子)】、全く無意味なDNA配列であるスペーサーなどが含まれます。各領域の呼び名、分類、それらの比率は文献によって異なり、下記は一例です。

4.トランスポゾン
トランスポゾン(転移因子)とは、細胞内でゲノム上の位置を転移(transpose)するDNA配列をいいます。トランスポゾンはヒトゲノムの実に46%を占めています(※4)。DNAの断片がそのまま転移するDNA(型)トランスポゾンと、1度RNAに転写されてから、DNAに逆転写されて転移するレトロトランスポゾンがあります。レトロトランスポゾンには、両末端に数百~数千塩基対の反復配列(LTR)を持つLTR型レトロトランスポゾンと、それらを持たない非LTR型レトロトランスポゾンがあります。
理化学研究所の国際共同研究グループは、レトロトランスポゾンの1種で、200塩基対以上の「長鎖ノンコーディングRNA」(lncRNA)を網羅的に解析し、それらのヒトゲノム上での正確な位置や配列の特徴、細胞や組織での発現パターンを示した「ヒトlncRNAアトラス(地図)」を作成しました。調査した27,919個のlncRNAのうち19,175個が何らかの機能を持ち、うち1,970種は疾患に関与している可能性が示唆されました(※5)。その後の検討により、ノックダウンできた119種のlncRNAのうちの13種(11%)が、細胞の増殖、転写、翻訳、代謝、発生、創傷治癒など、さまざまな機能を持つことが明らかにされ、レトロトランスポゾンの機能の一端が明らかになりました(※6)。

5.ヒトゲノム中のレトロウイルス
レトロウイルスとは、感染後に細胞内でウイルス自身の逆転写酵素により、RNAゲノムから二本鎖DNAのコピー(プロウイルス)を作製し、それを宿主細胞のゲノム中に挿入するタイプのRNAウイルスをいいます。宿主生物の生殖細胞のゲノムに組み込まれたプロウイルスは、内在性レトロウイルスとして子孫に伝達されます。ヒトのレトロウイルスの例としては、ヒト免疫不全(AIDS)ウイルスや、ヒトT細胞白血病ウイルスがあります。内在性レトロウイルスがヒトゲノムに占める割合は8%にも達します。更に、ボルナ病ウイルスなど、非レトロウイルス型の内在性ウイルスが次々に発見されています(※7)。
哺乳類のゲノム中に内在化したレトロウイルスは有害なだけの存在ではありません。例えばヒトを含む哺乳類の胎盤形成に必須の遺伝子の中には、内在性レトロウイルスに由来する遺伝子が複数存在することが明らかにされており、更に最近、乳腺や脳でもレトロウイルス遺伝子が発現していることが報告されています。これらの事実は、ゲノムに内在化したレトロウイルスが、ヒトの進化の過程で新たな遺伝子資源として機能を付与され、ヒト遺伝子として機能していることを意味します(※7)。

6.ヒトゲノムの半分以上はウイルスとその関連物質?
京都大学ウイルス研究所の朝長啓造教授は、総説の中で次のように記しています:
「ヒトゲノムには、内在性レトロウイルス(HERV)が約98,000ヵ所に組み込まれており、LTR(長鎖末端反復)型レトロトランスポゾンが約158,000ヵ所に組み込まれていることが判明している。(中略)このことは、私たちが進化の過程で幾度となくレトロウイルスの感染を経験してきたことを意味している」(※7)。
トランスポゾンの起源については、一部は自己遺伝子由来の増殖因子の可能性もありますが、大部分は、長い進化の過程で感染した無数のレトロウイルスの化石、あるいはそれらの断片であるとする仮説が有力です。引用の文章もその立場で書かれていることは明らかです。この仮説によれば、トランスポゾンの最大の特徴である転移能力がウイルスの性質に由来する、と説明可能です。また、前項で挙げた胎盤等でのレトロウイルス遺伝子の発現も、レトロウイルス遺伝子の一部の発現であることから、レトロウイルスの断片がレトロトランスポゾン化したものが発現した、と説明できます(※7)。更に、レトロウイルスを、LTR型レトロトランスポゾンの一部に含める分類方法があります(※4)。また逆に、レトロトランスポゾンが自立したものがレトロウイルスの起源であると考える研究者もいます。このように、ヒトゲノムには、ヒト遺伝子の最大8倍ものレトロウイルスと、ヒトゲノムの半分近くものレトロウイルスの化石やその断片が含まれる可能性があります。このことは、ウイルスとヒトが長い進化の歴史を通して共存関係にあったこと、そして今後も共存せざるを得ないことを意味します。

(次の第66話では「ウイルスは無生物」との「常識」が怪しくなってきた現状を述べます。)

(馬屋原 宏)


引用文献
1)NIH: What is noncoding DNA? https://ghr.nlm.nih.gov/primer/basics/noncodingdna
2)福岡大学:http://www.sc.fukuoka-u.ac.jp/~bc1/Biochem/genome.htm
3)長谷川政美:https://kagakubar.com/evolution/22.html
4)脳科学辞典:トランスポゾン
https://bsd.neuroinf.jp/wiki/%E3%83%88%E3%83%A9%E3%83%B3%E3%82%B9%E3%83%9D%E3%82%BE%E3%83%B3
5)理化学研究所:https://www.riken.jp/press/2017/20170302_1/index.html
6)理化学研究所:https://www.riken.jp/press/2020/20200728_1/index.html
7)朝長啓造:http://jsv.umin.jp/journal/v62-1pdf/virus62-1_47-56.pdf