ヒトゲノム配列が決定された後の研究動向
「バイオインフォマティクス▲」とは、遺伝子に関連した実験データを解析し、有用な知識を得るための情報処理技術である。従来、バイオインフォマティクス技術はゲノム配列を決定するための実験支援が中心であったが、ヒトゲノム配列▼1が決定されたことを受けて、比較ゲノム▲、構造ゲノム解析、単一塩基多型(SNP)▲解析、ネットワーク解析などのポストゲノム配列技術▼2が注目を集めている[★61-1]。
「比較ゲノム」とは、生物のゲノム配列全体を比較することにより、遺伝子の機能を推定する技術である。「ゲノム」とは、もともとはその生物の実現に必要な一揃いの遺伝子セットを意味していたが、近年では、一揃いの遺伝子セットを含む染色体全体の塩基配列の意味で用いられることが多い。このゲノム配列を調べると、地球上のすべての生物は共通な塩基配列からアミノ酸配列への翻訳規則を使用しており、同一の始原細胞から進化したと考えられている。実際、すべての生物に共通なリボソームRNAやヒストンタンパクの配列は近縁の生物種ほど配列も類似しており、分子進化が突然変異の積み重ねで起きていることを示している。ゲノムレベルでは、さらに、ゲノムの倍数化や種間での遺伝子の水平移動など、生命の進化を知る上で興味深い事実が次々と明らかにされつつある。
実際、ヒトなどの脊椎動物では、2回から4回程度の倍数化が起きたといわれており、また、トランスポゾンと呼ばれている遺伝子は染色体中で位置を変える性質があり、これが他の遺伝子に影響して突然変異体を誘発することが、トウモロコシやショウジョウバエの研究から明らかにされている。遺伝子数についても、高等生物ほど遺伝子数が多いということでもなく、むしろ、不要遺伝子を減らすことによって現在のような生物種の多様性が生まれたのではないかと考えられている。ヒトゲノムに続いて、現在ではチンパンジーのゲノムが注目を集めている。ヒトとチンパンジーはゲノムレベルでの違いはわずか2パーセントしかないといわれている。ヒトとチンパンジーを分ける「智の遺伝子」探しが始まっている。
「構造ゲノム解析」とは、タンパク質▲の基本立体構造を網羅的に決定しようという研究である。ゲノム解析プロジェクトの進行により、遺伝子配列については膨大な実験データが蓄積された。これに比べ、タンパク質の立体構造情報が少ないことが遺伝子▲の機能解明を進める上での障害となっていた。この問題を解決するために、タンパク質の立体構造を網羅的に決定するプロジェクトが全世界レベルで進行中である。日本でも、約一万種といわれているタンパク質の基本構造の3割に当たる3000種を5年間で決定するプロジェクトが2002年度から始まっている。タンパク質の基本構造が決まると、ホモロジーモデリング手法▼3により、配列情報から立体構造情報を推定することができる。これを用いてタンパク質と低分子化合物の相互作用を計算機シミュレーションし、薬剤候補を探索する「仮想スクリーニング」の研究が注目されている。
突然変異の集積が体質を決める
「単一塩基多型(SNP)解析」とは、進化的に保存されている遺伝子の変異に関する解析である。ゲノム解析プロジェクトの進展により、比較的安価に遺伝子配列を決定できるようになったが、多くの人の遺伝子を調べると、さまざまな突然変異が塩基レベルで蓄積していることが判明した。遺伝病の研究から遺伝子の突然変異が病気を引き起こすことは古くから知られていたが、正常人においても、平均1000塩基に1塩基程度の突然変異を持つことが明らかになってきた。このような変異の集積が酒に強い、弱いというような体質の違い、背が高いとか体重が重いというような体型の違いを引き起こすと考えられている。また、がんや糖尿病、高血圧のような疾患とSNPとの関係、薬の副作用とSNPとの関係も明らかにされつつあり、統計的解析、主成分分析、データマイニングなどによる解析が進められている。ただし、このような解析には遺伝学の知識が不可欠であり、単一塩基多型解析も染色体上の位置情報を加味したハプロイド解析▼4が注目を集めている。
「ネットワーク解析」の中心となるのは、遺伝子の活性・抑制関係をモデル化するための遺伝子ネットワーク解析およびタンパク質の相互作用をモデル化するためのプロテオーム▲解析▼5である。細胞内では、遺伝子あるいはその産出物であるタンパク質が単独で働くことは少なく、多くのタンパク質との相互作用により高次な生命現象を実現している。遺伝子ネットワーク解析では、DNAチップなどから得られるメッセンジャーRNAの濃度情報から発現量が変化している遺伝子群を解析することにより、遺伝子の活性化、抑制化のネットワークを同定する。
プロテオーム解析では、細胞中に存在するタンパク質およびその複合体の濃度を測定することにより、タンパク質の相互作用ネットワークを同定する。ただし、ネットワークを同定する際に、タンパク間相互作用をモデル化するために必要な化学反応定数、例えば、タンパク質の結合や乖離のしやすさを表す結合定数や乖離定数はすべて実験で求められるわけではない。そこで、遺伝的アルゴリズムのような最適化手法を用いて、未知の化学反応定数を実験データで求められたタンパク質の濃度などから推定する方法が活用されている。
|