『あれ、何だっけ？』がAIを最強にした。人間と同じ忘れ方で起きた奇跡

──AIが”本当に理解する”未来を開くLog-Linear Attention
なぜAIは「長い話」が苦手なのか？
軽くなるけれど、忘れっぽい
1. ──Linear Attention の葛藤
記憶の引き出しを”階層化”する
1. ──Log-Linear Attention の革新
2. 人間らしい記憶のメカニズム
実際にどう違うの？
これからのAIに必要なのは”賢い忘れ方”
最後に──

──AIが”本当に理解する”未来を開くLog-Linear Attention

あなたが読みかけの本の中で「あれ？さっきの名前、誰だっけ？」と数ページ前に戻ったことはありませんか？

私たちの記憶には”焦点”があります。
最近読んだページは鮮明に覚えていても、最初の方はうっすら──でも、それで十分だったりもします。
すべてを詳細に覚える必要はなく、大事なことを”うまくまとめて”持っていられるかが鍵なのです。

実は、今のAIにも、そんな”記憶の仕方”が求められています。
そして今回ご紹介する「Log-Linear Attention」は、その鍵を握る技術です。

なぜAIは「長い話」が苦手なのか？

現在のAIの多くが使っている「Transformer」という仕組みは、文章を理解するうえで非常に賢い構造を持っています。
ただひとつ、大きな弱点があります。

それは、系列が長くなればなるほど、処理がどんどん重くなるということ。

計算量は「系列長の2乗」、つまり文字数が2倍になれば、計算は4倍に。
メモリ使用量も系列長に比例して増加し、1万文字でさえ現実的に厳しい──そんな限界が、今のAIの”集中力”を縛っていたのです。

軽くなるけれど、忘れっぽい

──Linear Attention の葛藤

この問題を解決するために登場したのが「Linear Attention」。
計算量を系列長に対して線形に抑え、メモリ使用量も定数に削減しました。

しかし、その代償は記憶力の低下。

Linear Attention は、まるで”ノート1ページ”にすべてをメモするようなもの。
固定サイズの隠れ状態を使用するため、最近のことを書き込むたび、古い情報が押し出されてしまうのです。
この固定サイズの制約が、特に連想記憶のような能力において根本的な制限となっていました。

記憶の引き出しを”階層化”する

──Log-Linear Attention の革新

Log-Linear Attention がもたらすのは「覚える量」ではなく「覚え方」の根本的な進化です。

この仕組みは、記憶を「引き出し」のように分け、しかもその引き出しの数を”対数的に増やす”という工夫をします。
具体的には、Fenwick tree（Binary Indexed Tree）という特別なデータ構造を活用し、系列を階層的に分割します。

人間らしい記憶のメカニズム

たとえば、直近の出来事は小さな引き出しに細かく保存され、時間が経つにつれてより大きな引き出しにざっくりとまとめられていきます。
これはまさに、私たち人間の記憶のよう。
最近話したことは鮮明に覚えていて、10年前の旅行は大まかに覚えている──そんな「記憶の濃淡」をAIに与えるのです。

この仕組みには、Fenwick tree という、効率的な前置詞合計計算とアップデートを可能にするデータ構造が使われています。
これは「効率よくまとめ、効率よく取り出す」ための、いわば”記憶の棚の並べ方”。
すべての情報を平等に扱うのではなく、大切なものに多くのリソースを割くという柔軟さを持っているのです。

実際にどう違うの？

──Mamba-2 と Gated DeltaNet での応用

研究チームは、実際のAIモデルでこの Log-Linear Attention を試しました。
Mamba-2 と Gated DeltaNet という最新アーキテクチャに適用した結果──

驚異的な性能向上

訓練時の計算量は O(T log T)、推論時の時間・空間計算量はともに O(log T)を実現しながら、系列の長さが2倍、4倍と増えても、性能の劣化が非常に少ないことが確認されました。
長い会話の中でも、最初の方にあった大事な情報を忘れにくくなったのです。

具体的な成果

特に注目すべきは、多重クエリ連想記憶（MQAR）ベンチマークにおいて、系列長やキー・バリューペアの数が増加しても高い精度を維持し続けたこと。
また、Needle-In-A-Haystack 実験では、長い文脈に隠された情報の検索能力において大幅な改善を示しました。

これは、単なる記憶量の話ではなく「記憶の構造」を変えたことの効果なのです。

これからのAIに必要なのは”賢い忘れ方”

Log-Linear Attention が示すのは、すべてを覚えるAIよりも、うまく忘れられるAIの方が現実的で賢いということです。

これは私たち人間と同じ。
「覚えておく価値のあること」を選び「そのとき必要な文脈」を適切な解像度で取り出す。
そんなAIが、次世代のパートナーになるはずです。

最後に──

AIがすべてを機械的に記憶する時代は、もう古いのかもしれません。

大切なのは”どう覚えるか”。

Log-Linear Attention は、AIに”人間らしい記憶”を与え、対話・検索・要約・創作など、あらゆる長文タスクに新風を吹き込む技術です。
この階層的マトリックス構造により、効率的な並列訓練と高速な逐次推論の両立が可能になりました。

もし今後、AIが「きちんと話を聞いてくれる」「長い相談にも最後まで付き合ってくれる」「最初に言った大切なことを覚えていてくれる」と感じたとしたら──それは、この”記憶の工夫”が確実に効いている証拠かもしれません。

参考：Log-Linear Attention