ヒトゲノム・プロジェクトの成果
このページの内容 |
ヒトゲノムの解読に精力的に取り組んできた 2 つのグループが,それまでの成果を公表した:
- 国際ヒトゲノム解読共同体 International Human Genome Sequencing Consortium ( IHGSC ) が Nature の 2001 年 2 月 15 日号で発表した。
- メリーランド州ロックビルにある,バイオ企業セレラ・ゲノミクス社 Celera Genomics が Science の2月16日号で発表した。
これらの成果は画期的なものであった。ここでは何が明らかになっていなかったのかを見てみよう。
何がわかっていないのか
2001 年の時点では,どちらのグループも,ヒト・ゲノムの完全な配列を決定していなかった。
我々のそれぞれの染色体は,一分子の DNA である。いずれは各染色体の端から端までの塩基配列が公表されるだろう。2001 年の時点では,数千にも及ぶ欠落部が残っていた。
彼らが公表したのはヒトゲノムの約90%に相当する塩基配列であった( おそらく非常に興味深い 90% を解読したもの )。
総合的に見ても,公表結果にはヒトゲノムの正確な遺伝子数が記載されていなかった。ただし,以下に示すゲノムの遺伝子数とは対照的に
その理由は, 遺伝子を分断しているイントロン の数が,
- 多数,かつ
- 長大なため
タンパク質をコードしている オープン・リーディング・フレーム (open reading frame,ORF)を探索するのが極めて困難なためである。
何がわかったのか
1. 遺伝子が予想されていた数よりもかなり少ない
上記 2 つのグループの推定遺伝子数にはやや違いがあるが,30,000 個から 38,000 個の範囲である。
- 以下の動物に比べると,ほんの 2倍多いだけである。
- そして,細胞に含まれるDNA 全体の 1 – 2% に相当するだけである。
- 当初,予測されていた遺伝子数 100,000 個の約 1/3 である。
- (2011年には,ヒトの遺伝子はおよそ 21,000 個まで減ってきている。)
われわれヒトは,小さな線虫やハエと同程度の複雑性なのだろうか?
おそらくそうではない。確かに,我々はこれらの動物と相同遺伝子を多く共有しているが [”オーソログ ortholog” (共通祖先を持つ異種間の相同遺伝子)という ] ,
多くの違いがある:
- 我々のタンパク質をコードしている遺伝子の多くは複数のタンパク質産物を合成している (たとえば,遺伝子の一次転写産物の 選択的スプライシング などが起こっている) 。平均して,オープン・リーディング・フレーム(ORF)のそれぞれから 2 – 3 個の異なるタンパク質が合成されている。したがって,ヒトの “プロテオーム” proteome (ゲノムの各遺伝子に対応する全ての蛋白質を指す)はハエや線虫の 10 倍以上になるだろう。
- 我々のゲノムの大部分は,
2. 遺伝子の多様性と密度
以下のような巨大な遺伝子も含まれている:
- ジストロフィン dystrophin は DNA が 240 万塩基対以上に伸張して,さらに79 個のエクソンを含んでいる。
- タイチン titin の エクソンは 363 個あり,約 38,000 個のアミノ酸から成るタンパク質をコードしている。
平均的なヒト遺伝子は,1,350 塩基対から成り,4 個のエクソンを含み,これらは,平均的に 450 個のアミノ酸からなるタンパク質をコードする。
それぞれの染色体上の遺伝子密度にも大きな変動があり,
- 第 19 染色体上( 合計 1,400 個の遺伝子がある )には 100 万塩基対あたり 23 個の遺伝子があるが,
- 第 13 染色体上には 100 万塩基対あたり 5 個の遺伝子だけである。
3. ヒトには無脊椎動物にない多くの遺伝子がある
ヒトならびに多くの脊椎動物には,ショウジョウバエや線虫のような無脊椎動物にはない遺伝子がある。
これらの中には,以下のものをコードする遺伝子がある:
- 抗原に対する 抗体 ならびに T 細胞受容体(T cell receptor for antigen, TCR)
- ヒト 主要組織適合遺伝子複合体( major histocompatibility complex,MHC)の移植抗体 [ 詳細についてはこちら ]
- 多くの種類のサイトカイン などを含む細胞間信号分子
- 血液凝固に関与する分子
- アポトーシス の仲介分子:これらのタンパク質はショウジョウバエや線虫にも認められるが,ヒトは極めて多様な組み合わせのタンパク質をもっている。
4. 遺伝子重複
1 個の mRNA 前駆体遺伝子から,塩基配列が 重複 (とえば, 不等乗換えによって) することによって多くの遺伝子が生じる場合がある。 たとえば,
- 嗅覚受容体の遺伝子 ( 数百個にも及ぶ )
- 種々のグロブリン遺伝子
5. 反復性 DNA
大量の反復性 DNA の存在が明らかとなっている。同じ配列が繰り返し繰り返し並び,DNA の塩基配列を組み立てる傷害の 1 つにもなっている。
- LINES ( long interspersed elements ) ロング・インタースパースト・エレメント
- 我々のゲノムの 16 – 19%
- Alu エレメントを含む SINES ( short interspersed elements ) ショート・インタースパースト・エレメント
- 約 12%
- レトロ・トランスポゾン retrotransposon
- 5 – 8%
- DNA トランスポゾン
- 約 3%
全体で,反復性の DNA は,我々のゲノムの 50% 以上に相当する。
次は何か?
- 遺伝子を探し続ける。
2010年3月現在,19,956個のタンパク質をコードしている遺伝子が特定されているが,おそらく1000個以上の遺伝子がまだ見つかるだろう。 - ヒト・プロテオームを決定する。
つまり,ヒトが合成するタンパク質の全数を決定する必要がある。
- 遺伝子の一群がどのように調和して発現しているかを分析する。
- さまざまな細胞で,
- 細胞の寿命で異なる時間に,
そのような分析により,有用な情報が得られるばかりでなく,遺伝子チップ技術への発展性もあり,さらにショウジョウバエからヒトへのわずかな遺伝子数の増加がどのように異なった表現型を発展させていったのかが理解できるだろう。
- 他の脊椎動物のゲノムを決定する。
これは我々がヒト遺伝子のことをより深く理解するだけでなく,何がヒトを特徴的にしているのか考えさせてくれる。
すでに、ヒトゲノムの大部分がマウスにおける密接に関連したホモログをもつことが明らかとなっている。
たとえば,
- ヒト第 17 染色体上の遺伝子群は(配列順序までも)マウス第 11 染色体のそれに極めて類似している。また,ヒト第 20 染色体とマウス第 2 染色体でも同様の現象が認められている。
- ヒトやマウス(ラットでも)は200~800個の塩基対が全く同一の配列を共有している。
- 遺伝子のエクソンにも同様の配列が存在する。とくにRNAプロセシングに関与している遺伝子でみられる。
- 遺伝子のイントロン内または近傍に同様の配列が存在する。とくにDNAの転写に関与しているタンパク質をコードする遺伝子でみられる。
- 遺伝子間にも同様の配列が存在する。とくに,Pax6のように,初期の発生にとって必須な遺伝子でみられ,それらの配列はエンハンサーとして機能しているようだ。
ヒトと齧歯動物が進化の過程で枝分かれして以来,6000万年の間どんな突然変異でも避けようとしたために,これらの領域が哺乳類の寿命にとって必須の機能を果たす様になったものと考えられる。
チンパンジーに関しては、別の項でヒトのゲノムと比較する予定である。
参考リンク |
|
April 04, 2020