情報の幾何学とは?
情報と言えば、0と1のビット列で表現されたコンピュータの世界を連想するかもしれない。
そこでは、論理、アルゴリズム(算法)、代数といった理論が基礎となる。また、通信などにおける不確実な情報の量を考えれば確率統計が、観測データに対するシステム制御の分野では解析学がその土台となる。一方、幾何学に基礎を置く理論は意外に少ない。
しかしながら、我々が日常体験するように(おそらく脳内の情報表現や処理では)、ある一連の情報は連続的につながっているし、ある情報はある情報に(空間的に)近いなど、実はかなり幾何学的にとらえることができる。理論研究でも統計の分野では、既に1945年に確率分布の全体をリーマン空間▼1[★56-1]としてとらえる構想があったが、その後なかなか具体的な成果は得られなかった。
情報幾何学の進展
情報幾何学は、このような動機をもとに、先の確率分布の空間に関する理論を発展させることで、統計推論の常套手段である「最尤(ゆう)推定法」がなぜよいのかを明らかにした。さらに、その双対な幾何学構造▼2は、統計学のみならず、システム理論、情報理論、ニューラルネットの学習、数理計画の最適化法、数理物理の可積分系▼3、量子観測理論などさまざまな分野に進展して、強力な数理解析の方法論を与えている。情報幾何学では、あるパラメータ値に対する確率密度関数や制御システム、あるいはニューラルネットワーク・モデルなどが、空間上の1点に対応する。
したがって、異なるパラメータ値のモデルは別の点に対応する。 また、そうしたモデルがなす空間は曲がったり距離尺度が一定でないものではあるが、モデルの集まりの中でモデル同士の近さ(距離)を考えることで、それらに共通した幾何学的な扱いが可能となり科学的な議論ができる。
そこで情報幾何学が活躍する。
例えば、観測データを最もよく近似するパラメータ推定の問題は、観測データとモデルとの距離を最小化するもので、幾何学的には観測データからモデル空間へ直交射影した点におけるパラメータ値を求めることに相当する。別の見方では、距離を評価関数(目的関数とも呼ばれる)とすれば最適化の問題に帰着するし、データ提示ごとに反復的にパラメータを修正すれば学習過程ともみなせる。さらに、観測データが部分的にしか得られない場合に、データからのパラメータ値の推定(m-step)と、そのパラメータ値をもつモデルが生成するデータの期待値による欠測部分の補間(e-step)を、★56-2のように繰り返しながら解を求めるEMアルゴリズムなどにも応用されている。
さらに新しい試みとして
筆者は、情報幾何学の分布関数がある変数変換を通じて、あいまいな意思決定を表すファジィ平均化▼4、および、個人選考や市場シェアを表すマーケティングモデル(生産関数など)に一致することを指摘した(*56-1)。
また、インターネット▲などにおける情報探索でも、人々はさまざまな目的や観点に従った判断を意識的あるいは無意識に行っていることに着目し、視点の重要度に応じて情報の関連性を動的に生成する情報探索の支援モデルに、情報幾何学を具体的に応用している(*56-2)。
さらに別の課題として、分散ネットワーク上のコンピュータの性能の違いが、リーマン空間的な場所ごとの距離尺度の違いとして表現できそうなことから、性能の異なるコンピュータ間の負荷を均一化して、ネットワーク上の複数のコンピュータで効率的に問題を解く手法なども検討している(*56-3)。
異分野融合は温故知新
以上、情報幾何学はこれまで全く異なる分野であった統計、通信、制御、最適設計、数理物理、さらに、あいまい意思決定、分散コンピューティングなどと密接な関係をもち、現在もそれぞれの分野でこの方向からの検討が着々と進められている。
20世紀後半からコンピュータとネットワークが急成長し、インターネットのような抽象的な空間も日常的に接する、実在化したとも言える世界となってきた。目に見えないミクロな分子や遺伝子の世界や、相対性理論の重力による曲がった宇宙空間とて、すでに実在する対象とは言いがたく、我々は必然的に抽象的な空間(対象世界)を考えざるを得ないように思われる。そうした対象をより理解するためにモデルを考えるのだと思えば、人類の英知としての難解な数学や抽象的な議論が役立つことも納得できよう。科学技術が高度化、細分化した現在、よりいっそう異分野の共通点を見いだす必要があるのかもしれない。
歴史を振り返っても、何の苦労もなく無から有は生まれるはずもなく、単なる寄せ集めの分野からも新しい概念や方法論は生まれてこない。既成にとらわれず、物事の見方から創り直す努力や、表現や対象にとらわれず、本質を見極める洞察力を磨くしかない。情報幾何学というアプローチには、次世代に向けたそうした可能性が秘められているように思う。
|