なぜ優れたAIエージェントが一部の領域にしか存在しないのか
理論上、私たちはすでにあらゆる問題を解決する優れたAIエージェントを手にしているはずです。
人材も資本も十分にあり、AIモデルの能力も日々向上しています。
しかし、結果は偏っています。
営業リードの発掘や顧客サポートの質問に正確に答えるエージェントは存在するのに、なぜ高品質なスライドを一貫して生成できるエージェントはないのでしょうか?
最もシンプルな説明は「複雑さ」かもしれません。
簡単な問題(顧客サポートへの回答など)が自然に先に解決され、スライド生成のようなオープンエンドな問題にはより多くの努力が必要だと。
しかし、この説明には矛盾があります。
コーディングは明らかに単純な応用分野ではないのに、コーディングエージェントは現在最も優れたものの一つであり、実際、他のどのエージェントよりも速く改善しているのです。
これはなぜ起きたのでしょうか?
答えは、採用の容易さが大規模なデータ収集を可能にし、それがコーディングエージェントの急速な改善につながったということです。
すべての開発者が承認なしで5分でCursorに切り替えられました。これがデータのフライホイール(後述)を生み出し、Cursorチームは時間をかけてより優れたアプリケーション体験を構築できたのです。
今では私たちのチーム全員が、コード生成にCursorのComposerモデルを信頼しています。
技術的複雑さと採用の難しさの組み合わせは、興味深い2×2のマトリックスを生み出します。
4つの象限で見るAI製品の位置づけ
採用が容易で、解決も容易な領域
採用が容易で解決も容易な領域は、最も明白な象限です。
2023年の時点で、Googleでの消費者検索が、ユーザーのあらゆる質問に対するカスタマイズされた回答に置き換わることを予測するのに、特別な先見性は必要ありませんでした。
これは基盤モデルプロバイダーの主要なユースケースであり、多くの新規参入者(Perplexity、You.comなど)もこれらのユースケースに群がりました。
しかし「解決が容易で採用も容易」な象限は価値の罠です。
あなたにとって参入障壁が低いということは、フロンティアラボ(最先端のAI研究所)にとっては障壁が存在しないということです。
より可能性が高いのは、彼らがすでにそれを構築しているということです。
これらは「明白な」ユースケースであるため、既存のチャットアプリケーションが最も高い使用量を見る分野です。
つまり、そのユースケースが何であれ、OpenAI、Google、Anthropicは、これらの分野でモデルを改善するために何百万ものデータポイントを収集しているのです。
先週リリースされたChatGPT Healthは、この方向への明白な一歩のように感じられます。
データアクセスに加えて、モデルプロバイダーはコストを助成し、膨大なユーザーベースを活用して、新しいアプリケーション分野を非常に迅速に学習できます。
要するに、あなたはモデルプロバイダーに押しつぶされる可能性が非常に高いのです。
興味深い点は、この象限ではロイヤリティが非常に低いということです。
私たちは皆、ユースケースに応じて複数のチャットエージェントを使用しており、ウェブ検索市場とは異なり、誰もが比較的対等な立場にあるように見えます。
もし支配的なブランドリーダーが現れるとすれば、私たちはモデルプロバイダーに賭けます。
採用が容易で、解決が困難な領域
なぜコーディングという、おそらく最も難しい問題の一つが、こんなに急速に進歩したのでしょうか?
最も重要なのは、採用が容易だったからです。
2023年にコードのスニペットをChatGPTに貼り付けるだけで大きな価値を得られましたし、Cursorは初期の品質が限定的だったにもかかわらず、それをはるかに簡単にしました。
すべてのエンジニアは通常、自分のIDEを選択する自由を持っているため、IntellIJやVSCodeからCursorへの切り替えは大きな負担ではありませんでした。
導入されると、非常に速いフィードバックループも持っていました。
ソフトウェアエンジニアは1日に何十回、何百回もCursorでコードを生成するかもしれません。
これがデータのフライホイールを生み出しました。
受け入れられた、または拒否された提案のすべてが、将来のモデル改善のためのトレーニングデータに追加されるのです。
このデータを手に、モデルの品質が時間とともに劇的に改善することは避けられませんでした。
注目すべきは、この象限の他の市場(スライド生成など)では、同じような細かいフィードバックループがないため、改善がはるかに遅いということです。
「解決が困難」なカテゴリーのものは、トークン使用量、技術的人材、そしておそらく最終的にはモデルのトレーニングと強化学習にわたって、大きな投資を必要とします。
採用の容易さは、そのより深い投資を可能にする強力なデータ取得のフライホイールです。
フロンティアモデルラボは、このような広く使用される生産性エージェントを自分たちの領域と見なしているようです。
彼らはすでにコーディングエージェントで激しく競争しており、すでに持っているドキュメントエディターを超えて、より多くのオフィススイート生産性ツールを立ち上げても驚きません。
言い換えれば、私たちの予測では、これらの市場はヘビー級の戦いになるということです。
小規模なプレーヤーは、莫大な資本支出なしには競争に苦労するでしょう。
しかし、ここでも粘着性は低いままです。
私たちの多くは複数のコーディングエージェントを実行しており、オフィス生産性ツールが改善するにつれて、最も美しいスライドを作ってくれるアプリに飛びつかない理由はありません。
粘着性の議論は、企業固有のカスタマイゼーション(Cursorルール、ブランドテンプレートなど)ですが、相互運用性や移行を可能にする単一の標準が登場する可能性があります。
採用が困難で、解決が容易な領域
これは、過去2年間で企業のAI採用が本当に離陸した領域です。
解決が容易と言うとき、製品の深みがないという意味ではありません。
しかし、LLMがEコマースの返品やパスワードリセットのためのプレイブックを実行する方法を想像するのは容易です。
ほとんどの企業がAIから勝利を求めているため「明白な」問題こそが、即座の採用のために彼らが向かった場所です。
これにより、これらの市場のリーダーたちの収益成長は驚異的なペースを実現しました。
この象限を差別化する2つの重要な要素があります。
第一に、これらの製品は個人的に採用できるものではありません。
サポートチケットやITヘルプデスクリクエストを処理するエージェントを購入することは、おそらく購入委員会を持つ組織レベルの決定です。
第二に、ユースケースの比較的な単純さは、エンタープライズ統合の困難で退屈な現実によって相殺されます。
レガシーエンタープライズシステムをナビゲートできるチームには、大きなアドバンテージがあります。
その統合ストーリーこそが、データの堀があるところです。
これらのエージェントから得られるデータはそれほど広く適用できるものではなく、企業はおそらくそれを使ってモデルをトレーニングするあなたの能力を制限するでしょう。
しかし、あなたは各顧客がどのように機能するかについてデータを収集しているのです。
時間が経つにつれて、これは全体として製品をより良くするのに役立ちますが、最も重要なのは、各顧客にとってあなたの製品がより粘着的になるということです。
次にやってくるエージェントは、その学習された専門知識を再現するのに苦労するでしょう。
この領域では、投資家は大規模なスタートアップを事実上の既存企業として扱っています。
これは、まだ行われるべき製品イノベーションがないということではありません。
非常にありそうです!
しかし、たとえばSierraやDecagonのようなものと競争できる理由が、より小規模なスタートアップにあるかどうかは、すぐには明らかではありません。
より不明確なのは、これらの企業が調達している資本が主にGTM(市場進出)を推進するために使用されているのか、それともコーディング特化モデルのように、明確な技術的堀が出現しているのかということです。
前者だけであれば、スタートアップはコストで競争せざるを得ないかもしれません。
採用が困難で、解決も困難な領域
採用が困難で解決も困難な問題は、4つの象限すべての中で(比較的)最も注目されていません。
複雑なエンジニアリングや運用ワークフローを解決することの潜在的価値は非常に高く、これらは通常、人間が何時間も何日もかかるタスクです。
残念ながら、これらのワークフローは企業ごとにかなりカスタマイズされており、つまり評価と実装が「解決が容易で採用が困難」な製品よりもはるかに面倒だということです。
私たちは困難-困難の象限に賭けをしており、ここで次の成長フェーズが見られると予想しています。
困難-困難市場は、いくつかの理由から今後数年で非常に急速に成長するでしょう。
第一に、推論モデルは現在、より複雑なタスクを処理するための計画を立てることができ、これは多段階のソリューションに取り組むのに役立ちます。
第二に、これらの問題を解決する複雑さの多くは、AI外のステップ(ワークフローの構築と設定)から来ています。
コーディングエージェントが良くなるにつれて、これはより簡単かつ速くなるでしょう。
最後に、企業はすでに低い果実を積極的に摘んでおり、それらがなくなったらより難しい問題に目を向けるでしょう。
ここでのデータの堀は最も複雑で、潜在的に最も価値があります。
ある企業のワークフローで専門知識を構築すれば、それを複製することは非常に困難になります。
製品を切り替えることは、経験豊富なエンジニアを解雇して新しい人に置き換えることに似ています。
コア機能で専門知識を構築する機会が潜在的にあります(たとえば、AWSの専門家であるSREエージェント)。
しかし、この改善サイクルは、データの量が少なく、検証可能性が明確でないため、コーディングエージェントの場合よりも大幅に遅くなります。
これらの市場のすべてに、天文学的な金額を調達した企業がある一方で(しばしば収益成長をはるかに上回って)、これらの企業が「解決が容易で採用が困難」カテゴリーの同等企業ほど定着しているとは想像しがたいです。
この市場では、まだ非常に長いゲームが残されています。
まとめ
このマップは固定されたものではありません。
両方の境界が変化するでしょう。
複雑さの面では、数か月ごとにモデル能力の劇的な改善が見られました。
しかし、モデルの改善は停滞しているように見えるため、この軸への関心は少なくなっています。
本当のエキサイトメントはUXを中心にしています。
私たちは長い間、AIアプリケーションのUX側面が十分に探求されていないと信じてきました。
ユーザーが製品を採用する方法を変える新しいUXパラダイムが開発されても驚きません。
ウェブ上のClaude Codeは、おそらくこれの最良の最近の例です。
ウェブブラウザですべての人が利用できるコーディングエージェントを作ることで、IDEやターミナルに怖気づくかもしれないユーザーがこれらのツールにアクセスできるようにしました。
彼らがどのような道を取ろうとも、私たちの賭けは、今後12〜24か月で困難-困難象限での勝者の台頭が見られるということです。
それはSierraやDecagonの成長ほどシームレスには見えないでしょう。
評価サイクルが長く、実装がより複雑で、おそらく全体的な成功率が低くなるでしょう。
しかし、企業がプロセスを改善し、データが改善されたモデルを可能にするにつれて、ここで信じられないほどの収益が生み出される可能性があります。
コメント