「投資はした。なのに成果が出ない」——多くの経営層の本音
homulaは、エンタープライズ企業向けにAIエージェントの戦略策定・PoC・実装・運用・内製化までを一気通貫で支援するAIインテグレーターです。
2025年から2026年にかけて、多くの日本企業がAIに本格投資しました。生成AIの全社ライセンス、PoCの量産、専任チームの設置——予算は確実に積み上がっています。にもかかわらず、経営会議で繰り返される問いは同じです。「結局、これでいくら儲かったのか」。
この感覚は日本に限りません。2026年5月5日のIBM「Think 2026」で、IBMはこの状況を明確に言語化しました。「多くの企業がAIに多額の投資をしたが、それが報われていると考えている企業はごく一部にすぎない(many have invested heavily in AI, but only few believe it is paying off)」——そしてその差を「AI divide(AIの分断)」と呼び、勝者と後れを取る企業の溝が広がっていると指摘しています(IBM Newsroom, Think 2026)。
本記事では、この「成果が出ない企業と出る企業」を分けているものが投資額ではないこと、そして2026年に勝ち筋となる「AIオペレーティングモデル(事業を回す仕組みそのものの再設計)」を、決裁者の実務目線で整理します。
「AIを増やす」ことと「成果」は比例しない
まず、現実を示すデータから入ります。各社の調査が示しているのは、投資の多寡と成果が比例していないという不都合な事実です。
| 調査・出典 | 示している事実(要点) |
|---|---|
| MIT NANDA「The GenAI Divide」(2025) | 生成AIのパイロットのうち、P&L(損益)に測定可能なインパクトを与えたのは約5%。残り95%は明確な財務リターンを生んでいないとされる |
| McKinsey「The State of AI」(2025) | AIに何らかのEBITインパクトがあると回答したのは約39%。だが多くはインパクト5%未満で、全社規模でスケールできているのは約3分の1にとどまる |
| IBM Think 2026 (2026-05) | 「投資は重ねたが報われていると感じる企業はごく一部」。差は“AIをどれだけ持つか”ではなく“事業プロセスにどれだけ深く組み込めているか”で決まる |
数値はいずれも報道・各社公表に基づく目安であり、調査手法や母集団により幅があります。重要なのは個々の数字の精度ではなく、複数の独立した調査が**「投資額ではない何か」が成果を分けている**と一致して指摘している点です。
象徴的なのはMcKinseyの分析です。同社の2025年調査によれば、**業務フローを再設計した企業はわずか約21%にとどまり、残りの約8割は既存の業務プロセスの上にAIを“乗せている”だけだといいます。そして、EBITインパクトと最も強く相関していた組織的変化が、ほかでもない「業務フローの抜本的な再設計」**でした(McKinsey, The State of AI 2025)。
つまり構図はこうです。AIを“導入”した企業は多いが、AIに合わせて“業務を作り替えた”企業はまだ少数。後者だけが成果を手にしている——これがAI divideの正体です。
成果が出ない4つの理由
なぜ多くの投資が報われないのか。失敗のパターンは、技術というより仕組みと運用の欠落に集約されます。各種調査でも、失敗要因の上位はモデルの性能不足ではなく「成功基準が曖昧」「データやツールにアクセスできない」「評価が形骸化」といった運用面だと指摘されています。実務でよく見るのは次の4つです。
-
業務を再設計していない(“乗せただけ”問題) 既存の手順の一部にAIを差し込むだけでは、削減できる工数は限定的です。承認・引き継ぎ・例外処理といった業務の「つなぎ目」を作り替えないと、人手の待ち時間が残り、効果が出ません。
-
PoCで止まる(“本番に届かない”問題) 動くデモは作れても、本番に必要な権限設計・監査・例外時の人手介入・既存システム連携が整わず、検証フォルダの中で塩漬けになります。多くの企業でパイロットの大半が本番に到達しないことが、成果が出ない最大のボトルネックです。
-
評価運用(eval)がない(“品質を測れない”問題) AIの出力品質を継続的に測る仕組みがないと、「なんとなく良さそう」のまま広げてしまい、現場の信頼を失います。精度が落ちても誰も気づけません。
-
人に定着しない(“現場が使わない”問題) ツールを配っても、業務に組み込まれた使い方と判断基準が現場に根づかなければ使われません。結局シャドーAI(個人利用)に流れ、投資した正規ツールが空回りします。
4つに共通するのは、いずれも**「AIモデルが賢いかどうか」とは別の問題**だという点です。モデルを最新版に替えても、業務設計・本番化・評価・定着が欠けていれば成果は出ません。逆に言えば、ここを押さえれば、特別に高価なモデルでなくても成果は出せます。
勝ち筋の型——「AIオペレーティングモデル」
では、成果を出している企業は何をしているのか。IBMのArvind Krishna会長兼CEOの言葉が核心を突いています。
先行する企業は、より多くのAIを導入しているのではない。事業の回し方そのものを再設計しているのだ。AIを企業で動かすには新しいオペレーティングモデルが必要で、それは最重要インフラと同じ厳密さ・ガバナンス・スケールでAI駆動のシステムを運用することを意味する。 (IBM Think 2026, IBM Newsroom より要約・翻訳)
ポイントは「実験やパイロットの段階を抜け、AIが意思決定・処理時間・成果そのものを変えるエンドツーエンドの業務へ移行する」ことにあります。これを実務に落とすと、勝ち筋は4つの要素の組み合わせになります。
| 要素 | 何をするか | 欠けると起きること |
|---|---|---|
| ① 業務の再設計 | AIを前提に業務のつなぎ目を作り替える | 工数削減が限定的で、効果が出ない |
| ② ガバナンス | 権限境界・承認ポイント・監査ログを先に設計 | 本番化できない/止められない |
| ③ 評価運用(eval) | 出力品質を継続的に測り、劣化を検知する | “なんとなく”運用で信頼を失う |
| ④ 人への定着 | 使い方と判断基準を現場に根づかせ、内製化する | ツールが空回りし、形骸化する |
この4要素は、IBMが「AIオペレーティングモデル」として打ち出したエージェント/データ/自動化/ハイブリッドの構成や、「数体のエージェントから数千体へスケールしても、ガバナンスと監査をリアルタイムに保つ」という主張とも符合します。技術の華やかさではなく、運用の土台こそが成否を分けるという一点に、各社の議論は収束しています。
PoCで終わらせない——本番・内製化への流れ
4要素のなかでも、日本企業がつまずきやすいのが②本番化と④内製化です。多くのプロジェクトは「PoCは成功したが、その先に進めない」状態で止まります。ここを越える鍵は、最初から本番・内製化を見据えた順序で進めることです。
成果を出す企業は、おおむね次の段階を一直線で設計しています。
- 戦略(業務棚卸し): どの業務を、どこまでAIに任せ、どこで人が承認するかを先に決める。ROIの仮説と成功基準(eval指標)もここで定義する。
- PoC(最短): 最小の業務範囲で動くものを素早く作り、効果と現実的な課題を実データで確かめる。
- 実装(本番化): 権限・監査・例外時の人手介入・既存システム連携を整え、業務に組み込む。
- 運用: evalで品質を継続監視し、ガバナンスのもとで安定稼働させる。
- 内製化: 使い方と判断基準を現場に移管し、自社で改善を回せる状態にする。
逆に、PoCを“目的”にしてしまうと、いくら数を増やしても本番の谷を越えられません。「動くデモ」ではなく「再現可能な業務基盤」をゴールに置く——この目線の差が、成果が出る企業と出ない企業を分けます。
homulaの視点——成果に変えるための支援
ここまで述べた4要素と「戦略→本番→内製化」の流れは、まさにhomulaが支援している領域そのものです。homulaは創業以来、エンタープライズ向けAIエージェント・インテグレーターとして、戦略策定→PoC(最短5日)→実装→運用→内製化を一気通貫で支援してきました。投資を「成果」に変えるために、homulaは次の組み合わせを提供します。
- 業務の再設計とROIの見極め(戦略): AIエージェント・ブートキャンプでは、業務棚卸し・プロトタイプ構築・ROI試算を3〜5日で完結させます。「どこにAIを効かせ、どこで人が承認するか」を最初に固めることで、PoC倒れを防ぎます。
- 本番化を支えるツール接続(実装): Agensは、MCPを活用したエンタープライズ向け統合プラットフォームとして、200以上のツールと構築ゼロで接続します。個別連携の保守負債を抑え、PoCから本番への移行を加速します。
- ガバナンスと評価運用(運用): Agens Controlは、承認フロー・DLP・5年分の監査ログ・RBACをセットで提供します。「数体から数千体へ」スケールしても、誰が何にアクセスし、どこで人が承認するかを統制できます。
- 人への定着と内製化: 使い方と判断基準を現場に移管し、自社で改善を回せる状態を目指します。
homulaは活用技術として n8n / Dify / LangGraph などを用い、月額30〜80万円規模の小規模検証から始められます。実際に、対象業務の処理時間を93%削減した事例もあります。重要なのは大きく張ることではなく、「業務の再設計+ガバナンス+評価+定着」という土台を、小さく確実に積むこと——これが投資を成果に変える最短ルートです。
まとめ
2026年のAI投資は、「いくら投じたか」では評価されません。IBM Think 2026が示した通り、AI divideの本質は**「AIを増やすこと」ではなく「事業の回し方を再設計したか」**にあります。MITやMcKinseyの調査も、成果を分けているのが投資額ではなく業務の再設計と運用の土台であることを、それぞれの角度から裏づけています。
成果が出ない企業は、既存業務にAIを乗せ、PoCを量産し、ガバナンスと評価を後付けにします。成果が出る企業は、業務を作り替え、PoCから本番・内製化まで一直線に設計し、ガバナンス・評価・定着を最初から織り込みます。差は技術の派手さではなく、地味な運用の土台です。
自社のAI投資が「報われていない」と感じるなら、問うべきは「もっと高性能なモデルか」ではなく、**「業務を作り替えたか/本番に届いているか/品質を測れているか/現場に定着しているか」**です。
AI投資を成果に変えられるかは、「何を導入するか」より「どの業務を、どこまで任せ、どう運用に落とすか」で決まります。自社のどこから着手すべきか——業務の棚卸しとROIの仮説づくりから、一緒に整理しませんか。