topkeywordmaptextarchiveforumindex
 

Chapter1 知のダイナミクスChapter2 知のエレメント Chapter3 知のメソドロジーChapter4 知のエンジン
グローバルな知の行方を追う
  49
50
51

52

105
モード2
知識経済
ナショナル・イノベー
ションシステム

次世代イノベーション
モデル

教育工学
ネットワークの海図を描く
  53
54

55

56
57
106
電子商取引支援
マルチエージェント・
システム

ユビキタスコンピュー
ティング

情報幾何学
ネットワーク生態系
セマンティック
ウェッブ

生命の知を探る
  58
59

60
61

62

生物情報データベース
生物情報からの
知識発見

遺伝子知識
バイオインフォマティ
クス

高性能バイオコンピューティング


超微細レベルから地球規模までの視界
  63
64
ナノテクノロジー
地球環境
シミュレーション
 


遺伝子実験データを解釈するための知識を体系化する
小長谷明彦
遺伝子知識システム論


遺伝子知識の4つのレベル

遺伝子知識とは、疾病、薬物作用、細胞応答、発生、細胞分化、生命進化等の高次生命現象と遺伝子▲との関係について合理的説明を与えるための知の体系である。生命現象は複雑、かつ神秘的な現象ではあるが、分子レベルで考えれば決してブラックボックスではなく、膨大な数の遺伝子が織りなす極めて多数の生化学反応の結果とみなすことができる。遺伝子知識にはさまざまな表現法があるが、知識表現の複雑さの観点からは、「事実レベル」、「関係レベル」、「意味レベル」および「モデルレベル」に区分できる。また、表現対象の複雑さからは「分子レベル」、「ネットワークレベル」、「細胞レベル」および「個体レベル」に分けることができる。これらの区分は多分に便宜的なものであるが、「複雑さ」を軸とした分類は、遺伝子知識体系を理解する上でひとつの指針となりえよう[★60-1]。


「事実レベル」「関係レベル」の遺伝子知識

「事実レベル」の遺伝子知識とは、遺伝子に関して観測された実験データそのものである。分子レベルでは、塩基配列やアミノ酸配列などの配列情報やタンパク質立体構造における原子の3次元座標情報などがこれに相当する。ネットワークレベルでは、グルコースや温度刺激などを細胞に与えた際に遺伝子の発現量やタンパク質の濃度が変化する様子を測定した、遺伝子発現プロファイル▼1およびタンパク発現プロファイル▼2等がこれに相当する。細胞・個体レベルでは、体長や血液型などの表現系変異の情報や単一塩基多型(SNP)▲▼3と呼ばれる、遺伝子配列上の個体差に関する情報がこれに相当する。事実レベルの知識はそれ自身重要な知見であるが、個々の実験データのみから得られる知見は限られている。より有用な知見を導くためには、さまざまな実験データを相互に関係付けるための知識が必要となる。
「関係レベル」の遺伝子知識とは、遺伝子に関するさまざまな実験データを情報統合するための一段上の知識である。遺伝子を単位として塩基配列情報、アミノ酸配列情報、タンパク質立体構造情報、文献情報などを統合できれば、遺伝子に関する知識ベースを作ることができる。しかしながら、遺伝子データの関係付けは必ずしも自明ではなく、高度な生物学的背景知識を必要とする。例えば、遺伝子とタンパク質の関係はよく言われるような一対一の関係ではない。高等生物の遺伝子では遺伝子領域の組み合わせを換えることにより、ひとつの遺伝子座▼4から複数種のタンパク質を発現させる選択的スプライシング▼5という現象が頻繁に起きている。タンパク質の名前についても研究分野ごとに別名がつけられていることが多く、同一のタンパク質に名前が20も30もついていることも珍しいことではない。このように、遺伝子とタンパク質を対応付けるだけでも、「関係」に関するきちんとした定義が必要である。また、特定の生命現象に関係した遺伝子群を同定するために、多数の遺伝子発現量の時間的変化から遺伝子の発現や抑制関係を遺伝子ネットワークとして推定する研究が進められている(ネットワークレベル)。しかしながら、ニューラルネットワークやデータマイニング▲等の情報処理的手法により計算された「遺伝子ネットワーク」は必ずしも生物学的知見を反映するとは限らない。正しい遺伝子ネットワークを同定するためには、個々の遺伝子の機能に関する知識との整合性と実験による検証が不可欠となる(個体・細胞レベル)。



「意味レベル」「モデルレベル」の遺伝子知識

「意味レベル」の遺伝子知識とは、実験により確認された遺伝子の機能に関する知識である。MEDLINE(https://www.ncbi.nlm.nih.gov/entrez/query.fcgi)などの文献データベースには、1100万エントリもの生化学に関する文献が登録されており、遺伝子の機能を知る上で重要な知識の源となっている。このような文献情報から有用知識を抽出するためには、テキストマイニングおよび自然言語処理技術が有効である。また、計算機が意味処理を行うためには、計算機可読な形で遺伝子の機能を体系化する必要がある。このような観点から、バイオオントロジー▼6の整備が求められている。
「モデルレベル」の遺伝子知識とは、生命現象を計算機上で再現するための体系化された知識である。関係レベルの遺伝子知識では、あくまでも遺伝子間の静的な関係しか扱うことはできない。一方、実際の細胞の中で起きている生命現象は、時間的空間的なダイナミクスを持つ遺伝子の作用である。このような遺伝子の作用を計算機上で扱うためには、数理モデルを用いたシミュレーションが不可欠である。すでに分子レベルでは、分子動力学▲法により、タンパク質立体構造の時間的変化を原子レベルでシミュレーションすることが可能となっている。ネットワークレベルでは、遺伝子発現量変化やタンパク質の濃度変化を連立微分方程式やペトリネット▼7で表現することにより、細胞周期モデルやシグナル伝達▲などのモデル化が進められている。細胞・個体レベルでは、力学モデルを用いた細胞分割シミュレーションやセンサー情報伝達に着目した走化性シミュレーションなどが報告されている。
数理モデルによる生命現象の記述は始まったばかりであり、実際の生命現象とはまだまだ大きな乖離があるが、近い将来、細胞シミュレーションによる生命現象の予測がなされる日も来よう。

 



  対応ARCHIVE
  遺伝子▲
58 / 61 / 62
  単一塩基多型(SNP)▲
61
  データマイニング▲
38 / 59
  分子動力学▲
62
  シグナル伝達▲
58
  ▼1
遺伝子発現プロファイル
DNAチップやマイクロアレイなどを用いて遺伝子のメッセンジャーRNAの発現量を網羅的に測定したデータ。
  ▼2
タンパク発現プロファイル
タンパク2次元電気泳動や質量分析計を用いて、細胞中のタンパク質の濃度を網羅的に測定したデータ。
  ▼3
SNP (Single Nucleotide Polymorphism)
多くの個体に共通な遺伝子配列中の単一塩基単位の変異。
  ▼4
遺伝子座(locus)
DNA上において遺伝子の情報が格納されている場所。
  ▼5
選択的スプライシング (Alternative Splicing)
タンパク質に翻訳される領域(エクソン)を選択的に接合することにより、複数種のタンパク質を生成すること。
  ▼6
バイオオントロジー
バイオロジーおよび遺伝子に関するさまざまな概念、定義、名前を計算機が理解できるように体系化したもの。
  ▼7
ペトリネット
同時並行的に動作する現象を記述するための有効グラフ表現で、タンパク質の濃度をノードで、相互作用の関係を矢印で表したもの。
 
  ▲page top