AMAZON でお買物

AIに税金計算させてみたら…まさかの○○% 失敗!? 確定申告の未来とは

AI

「AIが税金の計算をする時代」がやってきた…?

年に一度の確定申告。
あの書類の山、意味の分からない用語、そして「この計算合ってるのかな?」という不安。
もし、AIが全部やってくれたら――そんな夢のような世界、もうすぐ実現すると思っていませんか?

実は、最新のAIでも「正確に」税金を計算するのは、想像以上に難しいという事実が、ある研究で明らかになりました。

その名も TaxCalcBench。
これは、AIが本当に税金を計算できるかどうかを試すために作られた、全く新しいベンチマーク(評価基準)です。

TaxCalcBench とは?:AIへの”税金テスト”

このベンチマークは、アメリカの連邦所得税の計算を、AIにやらせてみるという試みです。
税務専門家が作成した51種類のテストケース(年収、扶養家族、控除などさまざまなパターン)に対し、AIが税額を計算し、従来の正解とどれだけ一致するかを評価します。

「難しそう…」と思った方も安心してください。
TaxCalcBench が評価しているのは、主に次の部分です。

正しい金額が計算できたか、細かいルール(税表や控除の条件)を正しく理解しているか、そして計算結果が一貫しているかという3つの要素です。

では、結果はどうだったのでしょうか?

最新AIでも正解率はたったの 30% 前後!?

私たちが普段目にするような最先端AI――たとえば「Gemini 2.5」や「Claude Opus 4」といった有名なモデルたち。
彼らに税務書類を渡して計算させてみたところ、正しく税金を計算できたのは全体のわずか 30% 前後だったのです。

たとえば、W-2(給与明細)が2枚ある家庭というケースでは、AIが 26,000 ドルに対して税率を適用し、2,789 ドルの納税額を出しました。
しかし実際の正解は税表を使うべきケースで、正しい納税額は 2,792 ドルだったのです。
たった3ドルの差に見えるかもしれませんが、税務の世界ではこのズレは「誤り」と見なされます。

さらに、所得税控除の適用条件を誤る、間違った計算式を使う、必要な書類の内容を見落とすなど、ミスの種類も多岐に渡っていました。

何がそんなに難しいの? AIがつまずく3つの壁

1. 税表(Tax Table)の存在

アメリカの税法では、特定の所得金額に対して、計算式ではなく「表」を使って納税額を決めることが求められています。
ところが、AIはこれを無視して「○ドル × 10% + …」と、勝手に計算式を組み立ててしまうのです。

2. 複数の書類間の複雑な関連性

複数の書類間の関連性が複雑です。
たとえば「健康保険の補助(Premium Tax Credit)」を計算するためには、所得、家族構成、保険の加入状況など複数の条件を正確に読み取って、別の書類にその内容を反映させる必要があります。

3. 複雑で変わりやすいルール

税法には複雑で変動するルールがあります。
AIは事前学習された知識がありますが、税法のように毎年変わるルールや膨大な例外処理を完全に学び取ることは困難です。

じゃあ、AIは税金計算に使えないの?

結論から言うと――今のままでは、完全に任せるのは難しいというのが現実です。

でも、希望もあります。
正解率は年々少しずつ上がってきており、小さな金額のミスが多く「惜しい」結果が増えています。
また、一部の簡単なケースでは正しく計算できるようになっています。

今後は、AIと既存の「税計算エンジン」(人間が作った正確なソフトウェア)を組み合わせるハイブリッド型のアプローチが注目されています。

「AIで確定申告」は、夢のまま終わるのか?

AIに税金を計算させるという発想自体は、SFでもなんでもありません。
事実、私たちは日々AIに「翻訳」や「文章作成」を頼んでいます。

でも、「税金」はただの数字の足し引きではなく「ルールの迷路」を正しく歩く作業です。
しかもそのルールは毎年変わり、州ごとにも違います。

TaxCalcBench は、まるで「AIにとっての登竜門」。
このテストを完璧にこなせるようになったAIこそが、初めて私たちの確定申告を代行できる存在になるのかもしれません。

最後に:人とAIが”手を取り合う”未来へ

今回の研究が教えてくれたのは「AIに任せて安心」になるには、まだまだ道のりがあるということ。
でも同時に「AIがここまでできるようになった」という驚きも忘れてはいけません。

私たちがするべきことは「AIを過信する」のではなく「AIをうまく活かす」こと。

未来の確定申告は、AIがすべてを自動でやってくれる…かもしれません。
でもそれは、人間の知恵と工夫があってこそ、実現する夢なのです。

参考:TaxCalcBench: Evaluating Frontier Models on the Tax Calculation Task

コメント

タイトルとURLをコピーしました