人手不足の切り札になるのか？物理AIがカスタマーサービスを変える最前線

物理AI（フィジカルAI）がカスタマーサービスROIを押し上げる理由と、KDDI×AVITAの挑戦

「すみません、これってどこにありますか？」

レジ前の列が伸び、店員さんは走り回り、声をかけるのも申し訳なくなる。
そんな瞬間、あなたの目の前に”人っぽい”誰かがすっと近づいて、目を合わせてうなずき、やわらかい表情で案内してくれたらどうでしょう。

しかもその”誰か”は、人ではなくAI。
画面の中にいたAIが、ついに現場に降りてくる。
そんな流れを象徴するニュースが、KDDIとAVITAの「国産ヒューマノイド」構想です。

物理AIとは何か
なぜ今、接客に「物理AI」なのか
接客は「うなずき」と「間」が9割
KDDI×AVITAが目指す「国産ヒューマノイド」
実は「体」より大事なのは、見えない背骨
いきなりヒューマノイドではなく、まず「アバター」から
では、なぜROIが上がるのか
導入はいつ、どこから始まるのか
まとめ：AIが店頭に立つ未来は、「冷たさ」ではなく「余白」を増やす

物理AIとは何か

「賢いチャット」から「賢いふるまい」へ

最近よく聞く「生成AI」は、文章や画像を作ってくれるAIです。
一方で今回の主役は物理AI（フィジカルAI）。
これは、AIがただ考えるだけでなく、見て（認識）、判断して（推論）、動く（行動） ところまでを、現実空間でやってのける仕組みを指します。
ロボットや自律機械の世界ですね。

海外では、この波が「ロボティクス版の転換点」だと言われるほど、熱を帯びています。
でも本当に面白いのは、工場の中ではなく、接客という”人の気配”が必要な場所に入り始めている点です。

なぜ今、接客に「物理AI」なのか

労働力不足と、現場の”最後の1メートル”

企業はここ数年、業務を自動化してきました。
予約、決済、問い合わせの一次対応。どれも大切です。

ただ、現場はそれだけでは回りません。
人手が足りなくなると、最後に残るのはこういう仕事です。

イレギュラー対応（機械の故障、説明の行き違い、迷子のお客様）は、定型の自動化では補えません。
また「気持ち」を受け止める対応（安心させる、落ち着かせる、背中を押す）も、機械には任せにくい領域です。

AI Newsの記事でも、人手不足が進む中で、単なる定型業務の自動化だけでは不十分になっていると指摘されています。

接客は「うなずき」と「間」が9割

工場ロボットが得意でも、フロントは難しい理由

工場のロボットは、同じ動きを正確に繰り返すのが得意です。
ところが接客は、台本どおりにいきません。

AI Newsでは、接客に必要なのは言葉だけでなく、同期したうなずき、自然なアイコンタクト、安心感のある表情などの非言語コミュニケーションだと述べています。

ここでイメージしてみてください。
接客の現場は、料理教室というより「生放送の舞台」です。
お客様の表情や動きに合わせて、テンポを変え、声の温度を変え、空気を読む。
つまり、身体を使った会話なんです。

KDDI×AVITAが目指す「国産ヒューマノイド」

アバターの知見と通信インフラで、現場に立つAIを作る

今回のニュースの芯はここです。
KDDIとAVITAは、AVITAのアバター制作の知見と、KDDIの通信インフラを組み合わせて、実店舗など現実の商業環境でスムーズに動ける国産ヒューマノイドを作ろうとしています。

さらに機体は、ロボット研究で知られる石黒浩氏のコンセプトモデルをベースに、一般的な日本人の体格に近いコンパクトな骨格を採用。
皮膚はシリコンで表情を作り、カメラセンサーで対象を追い、視線が合うようにし、静かな空気圧アクチュエーションで滑らかに動く。
しかも動きには自然な「微妙な揺らぎ」まで入れる、とされています。

要するに、機械っぽさを消して「人の距離感」に寄せていく。
接客で一番難しいところに、真正面から挑んでいます。

実は「体」より大事なのは、見えない背骨

低遅延ネットワークとGPUが、ロボットを賢くする

ヒューマノイドを店頭に立たせるとき、最大の課題は「賢さ」ではなく「現場で止まらないこと」です。
映像データ、制御コマンド、センサー情報を、遅れなくやり取りする必要がある。
AI Newsは、高容量かつ低遅延のネットワークが必須で、KDDIがその”背骨”を担うと説明しています。

そして重要なのが、現場で得た映像・動作データを学習に戻す流れ。
接客のやり取りがそのまま”教材”になり、精度と自律性を高めていくという考え方です。

その計算基盤として名前が出ているのが、大阪堺データセンター。
KDDIはここでGPUを提供し、さらにGoogleの高性能生成AIモデル「Gemini」のオンプレミス提供も掲げています。
実際にKDDIは、2026年1月に大阪堺データセンターの運用を開始しています。

ロボットは”人に見える姿”ですが、賢さを支えるのは、舞台裏の照明や音響のようなインフラ。
ここが整って初めて、接客の現場に出られるんですね。

いきなりヒューマノイドではなく、まず「アバター」から

これは積み上げ型の物語

この挑戦が現実味を持つのは、いきなりロボットに飛んだ話ではないからです。
AI Newsによると、両社は以前からデジタルアバターを使った「次世代リモート接客プラットフォーム」を進め、ローソンやau Style店舗などで遠隔支援を行ってきました。

実際、ローソンとAVITAはアバター接客で協業し、時間や場所、年齢、性別、障害などの制約を越えた働き方を目指すと説明しています。
さらに2024年には、大阪駅前で「ローソンJAM BASE店」を開き、アバター接客に加えて生成AIを活用した体験も打ち出しました。

つまり、画面の中の接客から遠隔の接客へ、そして現場で動く接客へという階段を、一段ずつ上がっているわけです。

では、なぜROIが上がるのか

「コスト削減」だけで終わらない、3つの増え方

ROI（投資対効果）というと「人件費を減らす話」に聞こえがちですが、接客のROIはもっと立体的です。
物理AIが効いてくるのは、主に次の3つです。

待ち時間の短縮が、体験の価値を上げる

案内、簡単な質問対応、セルフレジのフォローなど、ここが速くなると店舗の”詰まり”が減ります。
人は不思議で、待ち時間が短いだけで、同じ商品でも満足度が上がります。

人は「むずかしい会話」に集中できる

定型の対応を機械が受け持つほど、人は本来の強みである共感や判断に集中できます。
実際、コールセンター領域でも、AIアシスタントが生産性を上げたという研究報告があります。
物理AIは、その恩恵を”店頭の1メートル”まで持ち込もうとしている、と考えると分かりやすいです。

「現場データ」が次の改善を連れてくる

AI Newsが述べるように、接客で得た視覚・動作データが学習に戻ると、ふるまいが洗練されていきます。
改善が積み上がるほど、運用が安定し、結果としてROIが伸びていきます。

導入はいつ、どこから始まるのか

秋の実証と、現場で避けて通れない論点

両社は、2026年秋から実際の商業施設で試験を始める予定で、 au Style店舗などの接点も検討するとされています。

一方で、現場に入れるなら避けて通れないのが ガバナンス（運用ルールと統制） です。
店頭ではカメラ映像や行動データが中心になります。
AI Newsも、物理空間での顧客データ利用に合わせて、統制の枠組みを適応させる必要があると述べています。

導入を考える企業向けに、現実的な”はじめの一歩”を整理すると、まずどこで行列が生まれ、どこで人が疲弊しているかというボトルネックの特定から始まります。
次に、低遅延・安定接続・学習のためのデータ設計を念頭に置いたネットワークと基盤の整備。
そして段階的な導入として、まずデジタルアバターや遠隔支援から試すのも合理的な選択です。