階層的RNNを用いた空間認知

ヒトが道に迷わないで目的地にたどり着けたり,近道をしたりといった空間中での適応的な行動を取ることができるのは,ヒトが認知地図(Cognitive map)と呼ばれる空間構造の内部モデルを脳内にもっているからであると考えられています.実際,ネズミの脳内に特定の場所でのみ活動する場所細胞やネズミの活動する平面に対応した2次元の格子状の活動パターンを示す格子細胞が発見されていることからも,認知地図の存在は裏付けられています.認知地図は文字通り空間を俯瞰的にとらえた地図のようなもので,認知地図上の自分の今の位置と目的地の位置から考えて,どう歩いていけば目的地につけるのかがわかる,というわけなのですが,ここで,その認知地図はどのようにして獲得できるのか,という疑問が生じます.通常,ヒトが得ることのできる感覚情報は,目で見た視覚映像や自分がどう歩いたか,といった主観的な感覚のみで,地図のような客観的視点からの感覚情報は得られないため,認知地図のような空間の客観的なモデルの獲得方法は自明ではありません.

われわれは,階層的なリカレントニューラルネットワーク(RNN)を用いて,いかにして主観的な視覚と運動感覚だけから認知地図の獲得が可能か研究しています.
 

RNNは時系列情報を学習可能なモデルであり,空間を移動することで得られる連続的な視覚・運動系列を取りまとめて認識することで,1シーンの感覚だけからではわからない構造を認識することができます.また,階層構造をもたせることで,入力と直接つながっていない層(上位レベル層)に認知地図のような抽象的な概念が獲得しやすくなります.われわれは,このような階層的なRNNにおいて,シミュレーション環境下のエージェントの主観的な視覚・運動の予測学習を行なうことによって,上位レベル層に認知地図のような内部構造が獲得されることを示しました.動画は,その獲得プロセスを示したものです.
 

 


 
動画後半では,上記のモデルに上位レベル層を加えることで,認知地図の獲得に加えて,目的地を訪問するためのプランニングを実現したモデルも紹介しています.このモデルでは,画像として与えられた目的地を認識し,追加の層に適切な初期値をセットする事でトップダウン的なプランニングの制御を可能にしています.