あの人、なんで今、渡ったんだろう?
信号が青に変わった瞬間に、前の人が歩き出した。
私たちはその行動を見て「ああ、青だから渡るんだな」と、特に深く考えることもなく理解します。
でも、もしあなたがロボットだったら?
「その人はどこへ行くのか? なぜ今なのか? どんな意図があるのか?」を考える必要があるかもしれません。
AIにとって「人の行動を理解する」というのは、想像以上に複雑で、時には不確かで、そしてコストがかかる作業です。
ですが今回ご紹介する新しい研究は「人の行動には予測可能な”スクリプト”がある」という人間らしい発想をもとに、AIがもっとスマートに私たちを理解できるようにする革新的な手法を提案しています。
新しい発想:「行動はプログラムで説明できる」
この研究のタイトルは『Modeling Others’ Minds as Code』。
直訳すると「他者の心をコードとしてモデル化する」です。
いままでは、AIが人間の行動を予測するには「たくさんのデータ」や「膨大な計算」が必要でした。
たとえば、過去にどんな行動をしたか、どんな目的を持っているか、どんな報酬を期待しているか……そんな推測を延々と繰り返してきました。
人間の行動を理解するために、AIは無数の可能性を探索し、確率を計算し、複雑なモデルを構築する必要があったのです。
でも、この研究チームはこう考えました。
「実際、日常の多くの行動は、もっとシンプルな”ルール”や”習慣”に従ってるんじゃない?」
たとえば「部屋を片付けるときは、まずおもちゃを椅子に置く」というパターンがあったとします。
あるいは「キッチンに入ったら、皿を洗う」という習慣や「横断歩道を渡るときは、青信号を待つ」という決まりごとなど。
私たちの日常は、こうしたお決まりのパターン、つまりスクリプトで満ちています。
研究チームは、これらのスクリプトをコード(プログラム)として書けるのではないか、と考えました。
人間の行動を、まるでコンピュータプログラムのように、条件分岐やループで表現できるのではないか。
この斬新な発想が、今回の研究の出発点となったのです。
ROTE:AIが「人の行動」をコードに変換する魔法の仕組み
この発想から生まれたのが、今回の研究の主役ROTE(ロート)です。
正式名称は”Representing Others’ Trajectories as Executables”(他者の行動の軌跡を実行可能なコードとして表現する)といいます。
仕組みは驚くほどエレガントです。
まずステップ1として、AIが「行動のコード」を生成します。
人の行動を観察したAIは、それに合いそうな Python のプログラムをいくつも作り出します。
たとえば「もしおもちゃを見つけたら→椅子へ運ぶ」といった条件付きの行動パターンをコードとして表現するのです。
AIは複数の候補となるコードを生成し、観察された行動を最もよく説明できるプログラムを探します。
次にステップ2として、最も合うコードを選び、予測に使う段階に入ります。
生成された複数のコード候補の中から「一番それっぽい」ものをベイズ推論という統計的な手法で選び出します。
そして、選ばれたコードを実行することで、次にどう行動するかを予測するのです。
この方法には、従来のAI手法にはない大きな利点があります。
まず、少ない観察データだけで、かなり正確に予測できるという点です。
膨大なデータを必要とせず、数回の観察から行動パターンを理解できます。さらに、一度コードを作れば、いろんな場面に応用できるという汎用性も持っています。
そして何より、予測の理由が「コード」という形で明示されるため、人間にも理解しやすいのです。
ブラックボックスではなく、透明性の高い予測システムとなっているのが特徴です。
家の中でも、仮想世界でも、人間と同じように動けるAIへ
研究チームはこの手法の有効性を検証するため、2つの異なる環境でテストを実施しました。
1つ目は、ブロックを運ぶ仮想空間「Construction」という環境です。
ここでは、エージェントが様々な目標に向かってブロックを配置していく様子を観察し、その行動パターンをコード化します。
2つ目は、家の中で掃除や片付けをするAIアシスタント「Partnr」という、より現実に近い環境でした。
結果は研究チームの期待を大きく上回るものでした。
ROTE は他のAI手法よりも最大 50% も高い予測精度を達成したのです。
これは驚異的な向上率といえます。
さらに印象的だったのは、実際の人間の行動データに対しても高い予測力を発揮し、人間並みの精度で行動を予測できたことです。
そして最も重要な発見は、新しい環境でも同じコードが再利用できるという点でした。
一度学習した「反時計回りにパトロールする」というスクリプトは、別の部屋や別の状況でも応用できます。
これは実用面で非常に大きな意味を持ちます。
つまり、ROTE は「行動を理解する賢いメモ帳」のような存在だといえます。
一度その人の”やり方”をコードとしてメモしてしまえば、別の場所や別の文脈でも同じように使えるのです。
人間が経験から学んだパターンを別の状況に応用するように、AIも学習したコードを様々な場面で活用できるようになりました。
「心を読む」ことは「コードを書く」ことかもしれない
従来のAIは「人の目的や信念を推測する」ことにこだわってきました。
心の理論(Theory of Mind)と呼ばれるアプローチで、相手が何を考え、何を望んでいるかを複雑なモデルで推論しようとしてきたのです。
でも、よく考えてみると、私たち人間同士でも、そうした複雑な心理を読み取ることは実はそれほど多くないかもしれません。
横断歩道に足を踏み入れた人を見たとき、私たちはその人の最終目的地や複雑な心理状態、あるいはピザにパイナップルをのせることへの意見を推測する必要はありません。
社会的慣習によって形作られた、一般的に理解されている「横断歩道のスクリプト」を適用すれば十分なのです。
こうした日常のスクリプトのような行動は、相手の深層心理を理解しなくても、十分に予測し、理解することができます。
むしろ、こうした習慣的な行動こそが、私たちの日常生活の大部分を占めているのです。
ROTE は、そんな日常の「当たり前」を見逃さず、プログラムとして整理し、AIに理解させようとしています。
深い心理分析ではなく、観察可能な行動パターンに注目することで、より効率的で実用的な人間理解を実現しようとしているのです。
これは「人の心を理解する」ための、まったく新しい入り口といえるでしょう。
哲学的に見れば、この研究は「心を理解するとは何か」という根本的な問いにも一石を投じています。
心を読むことと、行動パターンを理解することは、本当に別のものなのでしょうか。
もしかしたら、私たちが「心を理解した」と感じるとき、実際には相手の行動スクリプトを把握しているだけなのかもしれません。
まとめ:AIと人の距離を縮める、コードという言語
AIが人と自然に協調するためには、私たちの行動を理解する必要があります。
けれど、それをいちいち深読みするのではなく「よくあるスクリプト」としてとらえる。
そして、それをコードとして表す。
このシンプルで力強い発想が、ROTE という手法に結実しました。
ROTE の革新性は、3つの側面に集約されます。
第一に、少ない情報から行動を正確に予測できるという効率性です。
従来の手法が大量のデータを必要としたのに対し、ROTE はわずかな観察から本質的なパターンを抽出できます。
第二に、再利用できる「行動コード」で効率的に学習できるという拡張性です。
一度学んだパターンは、様々な状況で応用でき、転移学習が容易になります。
第三に、人間の直感にも近い「理解のしかた」を採用しているという親和性です。
私たちが日常的に行っている「あの人はいつもこうする」という理解の仕方と、ROTE のアプローチは本質的に似ているのです。
AIが「心を読む」のではなく「コードを書く」ことで人を理解する。
そんな時代が、もう目の前にきているのかもしれません。これは、AIと人間の関係性における大きなパラダイムシフトの始まりといえるでしょう。
より自然で、より効率的で、より透明性の高い人間理解のシステム。
ROTE が切り開く未来に、私たちは大きな期待を寄せることができそうです。
コメント