AMAZON でお買物

AIは“迷い”から賢くなる──Google も注目する新手法『EntropyLong』とは?

AI

「長い文章って、結局読めてないんじゃない?」

ある日、ふとした疑問がよぎりました。
最近のAI、ものすごく賢いはずなのに、長いドキュメントの冒頭に書いてあった重要な一文を、終盤でまるで忘れてしまっているかのような回答をすることがある。
あなたも、そんな場面に出会ったことはありませんか?

実はこの「長文になるとAIが文脈を見失う」問題、研究者の間でも大きな課題となっています。
そして、そんな課題に立ち向かうために生まれたのが、今回ご紹介する革新的な仕組み「EntropyLong(エントロピー・ロング)」です。

AIが「困っているところ」を見つけて、そこにヒントを与える

通常のAIは、訓練時にたくさんの文章をひたすら読み込んで「次に来る言葉は何だろう?」と予測しながら学習をします。
でも、文章が長くなってくると、最初の方にあった重要な情報を見落としてしまいがち。
人間で言うところの「前に何を読んだか忘れてしまう」状態ですね。

EntropyLong が画期的なのは、この「忘れかけている」「迷っている」部分をAI自身の予測から見つけ出すという発想です。
どうやってそれを見つけるのかというと「エントロピー」という、AIの”迷い度”を表す指標を使います。

エントロピーが高い = その部分でAIが「次の言葉が予測しにくい」と困っている

つまり、AIが「この辺り、よく分かんないんだよなぁ」と悩んでいる箇所を検出し、そこに意味のある文脈を補ってあげることで、長文の理解力をグッと引き上げるのです。

例えるなら、分からない問題にだけヒントをくれる先生

例えば、あなたが数学のテストを解いているとき、難しい問題だけをピンポイントで見抜いて「ここにはこういう公式を使うといいよ」とヒントをくれる先生がいたとしたら…それってものすごく助かりますよね?

EntropyLong は、まさにそんな「やさしく頼れる家庭教師」のような存在。
AIの訓練においても、すべての文章に無差別に補助を加えるのではなく「困っている部分」だけに効率よく”支援文脈”を提供するという仕組みを取っています。

この仕組みは4つのステップで構成されています:

  1. 困っている箇所(高エントロピーな位置)を適応的な閾値で検出
  2. その箇所に関係ありそうな文脈を大規模データから検索
  3. 本当に理解が深まったか(エントロピーが下がったか)を実際に確認
  4. 効果的な文脈だけをシャッフルして組み込み、学習用文章を生成

こうして、ただ長いだけの文章ではなく「本当に意味のある文脈が散りばめられた」高品質な学習データが出来上がるのです。

すごさは成績が証明してくれた

「ふーん、面白そうな仕組みだけど、結局どれだけ効果あるの?」

という疑問にも、しっかり答えがあります。

EntropyLong で訓練されたAIは、難問ぞろいの長文読解テスト「RULER」で 8K〜128K トークンの様々な文脈長において、他の手法(Ques や NExtLong)よりも顕著な成績向上を記録しました。
特に 128K トークン(膨大な文量!)の読解では 81.26 というスコアを達成し、Quest の 60.11 や NExtLong の 77.99 を大きく上回りました。
また、指示チューニング後の実世界タスクを評価する「LongBench-v2」でも、特に長文タスクで 31.50 のスコアを記録し、他手法を 8.40 ポイント以上上回る結果を示しました。
まさに「AIの記憶力革命」と呼ぶにふさわしい成果です。

「情報の多さ」ではなく「迷いをなくす」ことが未来を変える

これまでのAI開発は「もっとたくさんの情報を読み込ませよう」「より広く、深く」と”量”に頼るアプローチが主流でした。
でも EntropyLong は「どこでつまずいているのかを知り、必要なヒントだけを渡す」という”質”に着目しました。

この視点の転換が、今後のAI研究における新しいスタンダードになるかもしれません。

おわりに:迷ったときに支えてくれる存在の大切さ

人間でも、迷ったときにそっとヒントをくれる誰かの存在は、心強いものです。

EntropyLong は、AIにとってのそんな存在。
AIが自らの「迷い」を見つめ、それを解決できる情報を受け取り、成長していく──その姿は、どこか私たち自身の学びのプロセスにも重なります。

これからの時代、AIは”迷わない賢者”ではなく”迷いながら成長する仲間”として進化していくのかもしれません。

参考:EntropyLong: Effective Long-Context Training via Predictive Uncertainty

コメント

タイトルとURLをコピーしました