「使い放題」のエージェントが終わる
homulaは、エンタープライズ企業のAIエージェント導入を、技術選定から承認・監査・コスト統制まで含めて設計するAIインテグレーターです。
2026年6月、AIエージェントの世界で静かに、しかし決定的な地殻変動が起きています。主要ベンダーが相次いで、エージェントの課金モデルを**「定額(フラットレート)」から「従量(クレジット)」へ**切り替え始めたのです。これまでPoCの現場が暗黙の前提にしてきた「サブスクに入れば使い放題」という感覚は、この数週間で崩れました。
これは単なる値上げのニュースではありません。エージェントを本番で回す企業にとって、コストが「固定費」から「変動費」へと性質を変えるという、運用設計そのものに関わる転換です。本稿は、6月に集中したベンダー3社の動きを一次情報で確認し、なぜ定額が壊れるのか、そして日本企業がこの変化にどう備えるべきかを、コスト統制(FinOps for Agents)の観点から読み解きます。
この数週間で起きたこと——3社が同時に「従量」へ
まず事実関係を整理します。2026年6月、性格の異なる3社が、ほぼ同時に同じ方向へ舵を切りました。
| ベンダー | 変更時期 | 旧モデル | 新モデル |
|---|---|---|---|
| GitHub Copilot | 2026年6月1日 | プレミアムリクエスト枠 | AIクレジット(トークン従量・1クレジット=$0.01) |
| Anthropic(Claude) | 2026年6月15日 | サブスク枠で使い放題 | プログラム利用を別クレジット化(API実価格で従量) |
| OpenAI(ワークスペース・エージェント) | 2026年(無料プレビュー終了後) | 無料プレビュー | クレジット従量課金へ移行 |
3社それぞれを、一次情報で確認していきます。
GitHub Copilot——プレミアムリクエストを廃し「AIクレジット」へ
GitHubは2026年6月1日、Copilotの全プランを使用量ベースの課金へ移行しました(The GitHub Blog: GitHub Copilot is moving to usage-based billing)。従来の「プレミアムリクエスト」という回数の単位は廃止され、GitHub AIクレジットに置き換わります。クレジットは入力・出力・キャッシュを含むトークン使用量に応じて消費され、1クレジット=0.01米ドルです(GitHub Changelog: Updates to GitHub Copilot billing and plans)。
各プランには月額相当のクレジットが同梱されます(Pro+は月39ドルに39ドル分、Businessは1ユーザー19ドル、Enterpriseは1ユーザー39ドル)。コード補完とNext Edit Suggestionは引き続き無制限ですが、それ以外の機能はすべてクレジットで計測・課金される設計です。変化の体感は鋭く、「数時間で月間クレジットを使い切った」という開発者の反発が相次いで報じられました(gHacks: GitHub Copilot usage-based billing draws developer backlash)。
Anthropic——サブスクから「プログラム利用」を切り出す
Anthropicは2026年6月15日から、Claudeサブスクリプションのうちプログラム経由の利用を、対話チャットとは別の月次クレジットに分離します(The Decoder: Claude subscriptions get separate budgets for programmatic use)。対象は Claude Agent SDK・claude -p・Claude Code GitHub Actions・Agent SDK上に構築された外部アプリで、これらはAPI実価格でクレジットから差し引かれます。
クレジット枠はプランに応じておおむね月額に連動し、Proが20ドル、Max 5xが100ドル、Max 20xが200ドル、Teamは標準が1席20ドル・上位が100ドル相当とされています(The New Stack、InfoWorld: Anthropic puts Claude agents on a meter)。クレジットは繰り越し不可で、使い切ると次のリセットまで停止(API課金のUsage Creditsを有効化していればそれで超過分を賄う)という設計です。
Anthropicはこの変更を、年内3度目の調整と位置づけています。背景は明快で、エージェントが消費する計算量は、定額サブスクが想定していた水準をはるかに超えるという構造問題です。InfoWorldは、開発ツールのZed Industriesの試算として、サブスクは実質的にエージェント利用をAPI価格の15〜30倍ぶん補助していたとの見立てを伝えています(InfoWorld)。「使い放題」が持続不可能だった、というのが当事者の弁です。
OpenAI——ワークスペース・エージェントに従量課金
OpenAIが企業向けに投入したワークスペース・エージェント(チームで共有し、長時間タスクや業務ワークフローを組織の権限・統制の範囲内で実行する共有エージェント)も、無料プレビュー期間を終えてクレジット従量課金へ移行します(OpenAI: Introducing workspace agents in ChatGPT)。
課金は入力・キャッシュ入力・出力のトークンに基づくクレジット制で、OpenAIのレートカードによれば、GPT-5.5を使うエンドツーエンドの実行1回でおおむね5〜25クレジットを消費するとされています(OpenAI Help Center: ChatGPT Rate Card)。提供はChatGPT Business(1ユーザー20ドル)やEnterprise/Eduで、管理者は管理コンソールからワークスペース・エージェントの稼働状況と使用量を可視化できます。
3社の打ち手は、形は違えど同じ一点に収束します——「人数(席)」ではなく「使った量(トークン)」で課金する。これが2026年6月の景色です。
なぜ定額が壊れるのか——エージェントの経済構造
この同時多発は偶然ではありません。席課金(per-seat)というSaaSの大前提が、エージェントの登場で崩れたからです。席課金は「人間の頭数がソフトの消費量を決める」という想定に立っていますが、エージェントはこの前提を破壊します。1人のユーザーが起動した1体のエージェントが、自律的に何十回もLLMを呼び、ツールを叩き、長時間走り続ける——消費量が頭数から切り離されるのです(Flexera: From seats to consumption)。
この力学は、業界全体を席課金から消費・成果ベースへと押し流しています。Salesforceの Agentforce は会話1件2ドル・標準アクション0.10ドルといったFlex Creditsを、IntercomのFinは「解決1件0.99ドル」という成果課金を採用するなど、価格の単位そのものが人から行動へ移りつつあります(Getmonetizely: 2026 Guide to SaaS, AI, and Agentic Pricing)。今回の3社の動きは、その大きな潮流がフロンティアモデル提供者の本丸(コーディング・エージェント)にまで及んだことを意味します。
「全部入り・使い放題」のAIコーディング/エージェント・サブスクの時代が終わりつつある——複数の報道が口をそろえる総括です。固定費だと思っていたものが、実は誰かが補助していた変動費だった、という現実が表面化したのです。
従量化が経営に突きつける3つの宿題
定額から従量への移行は、情報システム部門と経営に、これまで存在しなかった3つの宿題を残します。
1. コストの予測不能性。トークン消費は非線形です。複雑な推論ほどトークンを食い、実験やプロンプト設計の差で使用量が乱高下します。Deloitteは、**最も高性能(=最も高価)なモデルを全タスクに既定で使ってしまう「トークン・マキシング」**という組織的行動を、コスト膨張の根因として指摘しています(Deloitte: AI tokens — how to navigate spend dynamics)。実際、ある医療系企業は半年で1兆トークンを消費し、財務が把握する前に600万ドルの想定外コストが発生したと報じられています。
2. 可視性の欠如。使った量で課金されるのに、誰が・何に・どれだけ使ったかが見えていない企業が大半です。ZyloのSaaS管理調査では、IT責任者の78%がAI・消費に紐づく想定外の請求を経験し、60%が生成AIの使用状況を十分に把握できていないとされます(Flexera/業界調査の整理)。可視性がなければ、予算もチャージバックも設計できません。
3. 予算と承認の不在。従量課金の世界では、「予算上限」「チーム別の枠」「高額モデルを使う前の承認」といったガードレールが、もはやあって当然の前提になります。FinOpsの実務はもともとクラウドコスト管理の方法論でしたが、いまやAI・SaaS・ライセンスを横断して技術の価値とコストを管理する方法論へと拡張しています。
ここで見落としてはならないのは、コスト統制を「契約・経理の話」に矮小化しないことです。トークン消費は、どのモデルを・どの業務に・どんな権限で使うかというエージェント設計そのものから生まれます。つまりコストは、後から経費精算で締めるものではなく、実行基盤の設計時点で決まってしまう。予算と権限と監査を、エージェントの実行経路に組み込んでおく必要があります。
homulaの観点——コスト統制を「設計」に組み込む
従量化が突きつける宿題への答えは、「安いベンダーを探す」ことではありません。どの業務に、どのモデルを、どの権限・予算・承認で当てるかを設計に落とし込むことです。homulaは、特定ベンダーに寄り切らないインテグレーターとして、この設計を支援します。
第一に、接続の集約です。AgensはMCPを活用し、200以上のツールと構築ゼロで接続する共通基盤を提供します。分散したSaaSや社内システムへの接続を一面に集めることは、使用量を「見える」状態に置く前提になります。
第二に、統制の一元化です。Agens Controlは、承認フロー・DLP・RBAC・5年分の監査ログを、プロバイダやフレームワークをまたいで一貫して効かせます。今回の従量化が経営に求めるのは、まさに「誰が・どこまで・何に使えるか」を権限として定め、重要な実行の前に承認を挟み、すべてを後から監査できる状態——コストの観点でも、統制の観点でも、答えは同じ実行基盤に収束します。これはランタイム・ガバナンスの標準化や「野良AI」が招く構造的リスクとも一直線につながる論点です。
第三に、モデル・ルーティングです。homulaが活用する n8n / Dify / LangGraph といった基盤は、タスクの難易度に応じてモデルを振り分ける設計を可能にします。日常的な処理は中小型モデルへ、本当に複雑な推論だけをフロンティアモデルへ——ある業界レポートは、こうしたルーティングが対象トラフィックで70〜80%のコスト削減を、品質を実用上落とさずに実現しうるとしています(Deloitte)。「全タスクに最上位モデル」という既定値を疑うだけで、従量課金下のコストは大きく変わります。
どの業務に・どのモデルを・どの予算と承認で当てるか。その当てはめとROI試算は、業務棚卸し・プロトタイプ構築を3〜5日(最短5日でPoC)で行うAIエージェント・ブートキャンプで素早く見極められます。コスト構造を最初に設計した業務ほど、本番化が速く、処理時間の大幅な削減(過去には93%削減の例も)まで一気に到達します。月額30〜80万円規模の小規模検証から、変動費を制御しながら段階的に広げるのが現実的です。
まとめ
2026年6月、GitHub Copilot(6/1)・Anthropic(6/15)・OpenAI(プレビュー終了後)が相次いで、AIエージェントの課金を定額から従量(クレジット)へ移しました。背景にあるのは、エージェントの計算消費が定額サブスクの想定を超え、「使い放題」が経済的に持続不可能になったという構造問題です。Anthropicの例では、サブスクが実質API価格の15〜30倍ぶんを補助していたとの試算すらあります。
この変化が日本企業に問うのは、「どのベンダーが安いか」ではありません。**「エージェントのコストを、予測し・可視化し・予算と承認で統制できる仕組みを、実行基盤に組み込んでいるか」**です。トークン消費はエージェント設計から生まれる以上、コスト統制はガバナンスと地続きです。接続を集約し(Agens)、権限・承認・監査を一元化し(Agens Control)、モデルを賢く振り分ける——この3点を設計に織り込めた企業から、従量化の時代でもエージェントを安心して本番で回し始められます。
エージェントを本番に乗せるなら、「どの業務に・どのモデルを・どの予算と承認で当てるか」を、課金が変わる前に設計として固めておくのが近道です。自社の業務とコスト要件に合った統制の置き方を、早めに整理することをおすすめします。