こんな未来、想像していましたか?
「AIといえばアメリカの話でしょ?」
そんなふうに思っていたのは、もう過去の話かもしれません。
最近、友人と話していたときのこと。
「最近の ChatGPT すごいよね」と盛り上がっていた中で、ふとこんな話題が出ました。
「そういえば、中国のAIってどうなんだろう?」
たしかに、アメリカの OpenAI や Google ばかりが注目されがちですが、アジアからもすごい波が押し寄せてきているんです。
その代表格が、中国の検索エンジン大手 Baidu(バイドゥ)が開発したERNIE(アーニー)というマルチモーダルAI。
聞いたことがない?
でも、今知っておくべき存在かもしれません。
ERNIE って何者? ChatGPT と何が違うの?
まず「マルチモーダルAI」って、なんだか難しそうに聞こえますよね。
でも、ちょっと想像してみてください。
あなたが質問をすると、それに対して「文章」だけでなく「画像」や「音声」など、複数の”感覚”を使って答えてくれるAI。
まるで人間が五感を使って状況を理解し、会話してくれるような感覚です。
これが「マルチモーダルAI」です。
そして、Baidu の ERNIE 4.5 は、そんなマルチモーダル機能を搭載した最新のAIで、ついにアメリカ勢を上回る実力を見せつけました。
驚異のテスト結果:GPT-4 や Gemini を上回る性能
AIの賢さを測るためのベンチマークテスト(知能テストのようなもの)では、なんと ERNIE が Google の Gemini 2.5 Pro や OpenAI の GPT-4.5 を上回るスコアを記録。
特に、視覚データの理解や数学的な推論において高い性能を誇っており、中国国内のユーザーだけでなく、今後は世界のユーザーも注目する存在になるかもしれません。
ちなみに、こうしたテストでは「MathVista」や「ChartQA」といったさまざまな分野でAIがどれだけ複雑な視覚情報を理解し、推論できるかが試されます。
ERNIE はこれらの試験でしっかりと実力を証明してみせました。
具体的には、MathVista で ERNIE が 82.5 点を獲得し、Gemini の 82.3 点、GPT の 81.3 点を上回っています。
また、ChartQA では 87.1 点を記録し、Gemini の 76.3 点、GPT の 78.2 点を大きく引き離しました。
それって、つまりどういうこと?
ここでちょっと想像してみましょう。
世界のAI技術がアメリカに集中していた時代が終わり、多極化が進んでいるということです。
かつては「AI=アメリカ」の構図でしたが、いまや中国も、そして欧州や中東の国々も独自のAIを育て始めています。
ERNIE の登場はその象徴とも言える出来事。
これは、私たち一般ユーザーにとっても実はすごく大きな話です。
なぜなら、選択肢が増えることで、競争が進んでAIの質が上がり、利用できる価格が下がり、自分の言語や文化に合ったAIが生まれるという好循環が生まれていくからです。
でも、心配なこともある?
もちろん、すべてがバラ色ではありません。
AI開発においては、倫理的なルールやデータの透明性も非常に大事です。
中国のAI開発については、政府の影響や情報統制などの懸念も根強くあります。
例えば、どんなデータを学習に使っているのかが不透明だったり、表現の自由が制限される可能性もゼロではありません。
だからこそ、AIを「どこが作ったか」だけで判断せず「どう使われているか」「誰のために作られているか」という視点も大切になってきます。
また、ベンチマークテストの結果は一つの指標に過ぎず、実際の業務での性能は異なる場合もあることを理解しておく必要があります。
まとめ:AIの未来は一つじゃない。あなたが選ぶ時代へ
Baidu の ERNIE が見せた進化は、AI業界にとって大きなターニングポイントかもしれません。
ChatGPT や Gemini だけでなく、中国発のAIにも目を向けることで、私たちの選択肢は確実に広がっています。
そして何より、AIが世界中で育っている今「どのAIを使うか」は、まさにユーザーであるあなたの手に委ねられているのです。
かつては「選ぶ」なんて贅沢な悩みだったかもしれません。
でも今は違います。
AIの未来は一つじゃない。
私たちはその未来を、選び、育て、共に進んでいくことができるのです。
参考:Baidu ERNIE multimodal AI beats GPT and Gemini in benchmarks
コメント