遺伝子知識の4つのレベル
遺伝子知識とは、疾病、薬物作用、細胞応答、発生、細胞分化、生命進化等の高次生命現象と遺伝子▲との関係について合理的説明を与えるための知の体系である。生命現象は複雑、かつ神秘的な現象ではあるが、分子レベルで考えれば決してブラックボックスではなく、膨大な数の遺伝子が織りなす極めて多数の生化学反応の結果とみなすことができる。遺伝子知識にはさまざまな表現法があるが、知識表現の複雑さの観点からは、「事実レベル」、「関係レベル」、「意味レベル」および「モデルレベル」に区分できる。また、表現対象の複雑さからは「分子レベル」、「ネットワークレベル」、「細胞レベル」および「個体レベル」に分けることができる。これらの区分は多分に便宜的なものであるが、「複雑さ」を軸とした分類は、遺伝子知識体系を理解する上でひとつの指針となりえよう[★60-1]。
「事実レベル」「関係レベル」の遺伝子知識
「事実レベル」の遺伝子知識とは、遺伝子に関して観測された実験データそのものである。分子レベルでは、塩基配列やアミノ酸配列などの配列情報やタンパク質立体構造における原子の3次元座標情報などがこれに相当する。ネットワークレベルでは、グルコースや温度刺激などを細胞に与えた際に遺伝子の発現量やタンパク質の濃度が変化する様子を測定した、遺伝子発現プロファイル▼1およびタンパク発現プロファイル▼2等がこれに相当する。細胞・個体レベルでは、体長や血液型などの表現系変異の情報や単一塩基多型(SNP)▲▼3と呼ばれる、遺伝子配列上の個体差に関する情報がこれに相当する。事実レベルの知識はそれ自身重要な知見であるが、個々の実験データのみから得られる知見は限られている。より有用な知見を導くためには、さまざまな実験データを相互に関係付けるための知識が必要となる。
「関係レベル」の遺伝子知識とは、遺伝子に関するさまざまな実験データを情報統合するための一段上の知識である。遺伝子を単位として塩基配列情報、アミノ酸配列情報、タンパク質立体構造情報、文献情報などを統合できれば、遺伝子に関する知識ベースを作ることができる。しかしながら、遺伝子データの関係付けは必ずしも自明ではなく、高度な生物学的背景知識を必要とする。例えば、遺伝子とタンパク質の関係はよく言われるような一対一の関係ではない。高等生物の遺伝子では遺伝子領域の組み合わせを換えることにより、ひとつの遺伝子座▼4から複数種のタンパク質を発現させる選択的スプライシング▼5という現象が頻繁に起きている。タンパク質の名前についても研究分野ごとに別名がつけられていることが多く、同一のタンパク質に名前が20も30もついていることも珍しいことではない。このように、遺伝子とタンパク質を対応付けるだけでも、「関係」に関するきちんとした定義が必要である。また、特定の生命現象に関係した遺伝子群を同定するために、多数の遺伝子発現量の時間的変化から遺伝子の発現や抑制関係を遺伝子ネットワークとして推定する研究が進められている(ネットワークレベル)。しかしながら、ニューラルネットワークやデータマイニング▲等の情報処理的手法により計算された「遺伝子ネットワーク」は必ずしも生物学的知見を反映するとは限らない。正しい遺伝子ネットワークを同定するためには、個々の遺伝子の機能に関する知識との整合性と実験による検証が不可欠となる(個体・細胞レベル)。
「意味レベル」「モデルレベル」の遺伝子知識
「意味レベル」の遺伝子知識とは、実験により確認された遺伝子の機能に関する知識である。MEDLINE(https://www.ncbi.nlm.nih.gov/entrez/query.fcgi)などの文献データベースには、1100万エントリもの生化学に関する文献が登録されており、遺伝子の機能を知る上で重要な知識の源となっている。このような文献情報から有用知識を抽出するためには、テキストマイニングおよび自然言語処理技術が有効である。また、計算機が意味処理を行うためには、計算機可読な形で遺伝子の機能を体系化する必要がある。このような観点から、バイオオントロジー▼6の整備が求められている。
「モデルレベル」の遺伝子知識とは、生命現象を計算機上で再現するための体系化された知識である。関係レベルの遺伝子知識では、あくまでも遺伝子間の静的な関係しか扱うことはできない。一方、実際の細胞の中で起きている生命現象は、時間的空間的なダイナミクスを持つ遺伝子の作用である。このような遺伝子の作用を計算機上で扱うためには、数理モデルを用いたシミュレーションが不可欠である。すでに分子レベルでは、分子動力学▲法により、タンパク質立体構造の時間的変化を原子レベルでシミュレーションすることが可能となっている。ネットワークレベルでは、遺伝子発現量変化やタンパク質の濃度変化を連立微分方程式やペトリネット▼7で表現することにより、細胞周期モデルやシグナル伝達▲などのモデル化が進められている。細胞・個体レベルでは、力学モデルを用いた細胞分割シミュレーションやセンサー情報伝達に着目した走化性シミュレーションなどが報告されている。
数理モデルによる生命現象の記述は始まったばかりであり、実際の生命現象とはまだまだ大きな乖離があるが、近い将来、細胞シミュレーションによる生命現象の予測がなされる日も来よう。
|