AIコーディングエージェント市場に「第3極」が出現した
homulaは、エンタープライズ企業向けにAIエージェントの戦略策定・PoC・実装・運用・内製化までを一気通貫で支援するAIインテグレーターです。本記事では、2026年3月時点でAIコーディングエージェント市場に起きている構造変化を分析し、企業が取るべきアクションを提示します。
2025年まで、エンタープライズのAIコーディングエージェント市場は事実上の二強体制でした。AnthropicのClaude CodeとOpenAIのCodex CLIが、ターミナルを主戦場にしのぎを削る構図です。ところが2025年11月、GoogleがAntigravityを発表したことで、市場は一変しました。
Antigravityは「ターミナル型エージェント」ではなく、「エージェント・ファーストIDE」という全く異なるカテゴリの製品です。複数のAIエージェントを並列に走らせ、ブラウザ操作まで自律的に行わせる「ミッション・コントロール」型のUIは、従来のCLI型ツールとは根本的に異なる設計思想に基づいています。
CLI型とIDE型:2つの実行モデル
この構造変化を理解するには、まず2つの実行モデルの違いを押さえる必要があります。
**ターミナル・ファースト(CLI型)**は、エージェントがワーキングディレクトリ内でファイルを読み書きし、コマンドを実行するモデルです。Claude CodeとCodex CLIがこの類型に属します。ガバナンスはサンドボックスと承認ポリシーで制御され、開発者がリアルタイムでエージェントの挙動を監視します。
IDE型エージェント環境は、エージェントがIDE内で計画を立て、タスクを分割し、並列実行するモデルです。AntigravityのManager View(マネージャー・ビュー)では複数のエージェントがバックグラウンドで自律的に動作するため、開発者は「個々のコマンド」ではなく「タスクの完了状態」を監視します。
ただし2026年現在、この二分法は絶対的なものではなくなりつつあります。Claude CodeはターミナルだけでなくIDE拡張、デスクトップアプリ、ブラウザにも対応し、Codex CLIもIDEとクラウド環境に展開しています。重要なのは「出自がどちらか」ではなく、「デフォルトの自律度がどこに設定されているか」です。
Googleの参入が意味するもの
Antigravityの真のインパクトは、技術的な差異よりも市場構造への影響にあります。
Gartnerが2025年のAIコードアシスタント市場を30〜35億ドルと推計する中、Googleはこの成長市場に「無料プレビュー」という価格破壊で参入しました。個人用Gmailアカウントがあれば誰でも利用でき、Gemini 3.1 Proという最新のフロンティアモデルが追加コストなしで使えます。
Stack Overflowの2025年調査では開発者の84%がすでにAIツールを利用していますが、SonarSourceの調査では相当数が個人アカウント経由でアクセスしている実態が報告されています。ここに「無料で使える高機能IDE」が加わったことで、企業が把握できないAI利用(Shadow AI)の温床が、もう一つ増えたことになります。
3つの設計思想を解剖する
3社のコーディングエージェントは、「AIエージェントは開発者とどう関わるべきか」という問いに、それぞれ異なる回答を出しています。
Claude Code:「深い推論 × 巨大コンテキスト」— シニアエンジニアの思考パートナー
Anthropicの設計思想は明確です。エージェントは単なるコード生成器ではなく、複雑な問題を解くための思考パートナーであるべきだ、と。
Claude Codeは自律的な行動の前にユーザーへの確認を求める傾向が強く、コードの命名規則やアーキテクチャの一貫性を維持するための「Adaptive Thinking(適応的思考)」モードを備えています。200Kトークンの公称コンテキストウィンドウ(100万トークンのベータも提供中)に加え、会話が長くなるとLLMが自動的に経緯を要約してコンテキストを圧縮する「Context Compaction」を採用。大規模なレガシーコードベースでも推論精度を維持する設計です。
開発者コミュニティでは「最も人間らしい同僚」「設計意図を説明してくれるため、シニアエンジニアの指導を受けているようだ」と評される一方、「実行速度が遅め」「提案が慎重すぎることがある」との声もあります。
エンタープライズ視点での強み: CLAUDE.mdによる組織横断のポリシー適用(/etc/claude-code/CLAUDE.mdにマネージドポリシーを配置可能)、OpenTelemetryによるテレメトリエクスポート、SOC 2 Type II取得済み。
Codex CLI:「高速生成 × サンドボックス」— 実装の量産マシン
OpenAIのアプローチは、開発者のフローを中断させない「即時性」に全振りしています。
GPT-5.3-Codexをベースモデルとし、さらにCerebras社との提携によるCodex-Sparkモデルは1,000トークン/秒超の超高速生成を実現。試行錯誤のサイクルをミリ秒単位に短縮することを志向しています。2026年2月にはmacOS向けの「Codex App」もリリースし、CLIとデスクトップアプリの両面から開発者のワークフローに統合する戦略です。
セキュリティ面では、OSレベルのサンドボックスを標準装備している点が特徴的です。Full-Auto(YOLO)モードでもmacOSではSandbox Exec、LinuxではDockerコンテナ+iptablesで外部通信を遮断する設計が公開されています。
エンタープライズ視点での強み: AGENTS.mdによるオープンな指示ファイル標準(6万以上のOSSプロジェクトが採用を表明)、Worktreeによる並列試行、SOC 2 Type II対応。
Antigravity:「エージェント群のオーケストレーション」— 開発者をアーキテクトに変える
Googleが描くビジョンは、他の2つとは根本的に異なります。単一のエージェントではなく、複数の専門エージェントを指揮するプラットフォームとしてのIDEです。
AntigravityのManager Viewは、エージェントが計画(Planning)を立て、タスクを分割し、並列して実行するプロセスを可視化する「ミッション・コントロール」として設計されています。Editor View(コード編集画面)とManager View(エージェント管理画面)の二面構成により、開発者はコーディングとタスク管理を切り替えながら作業できます。
さらに、Geminiの「Computer Use」モデルに基づくブラウザ・サブエージェントにより、エージェントがブラウザを操作してUIの検証やWebドキュメントの参照を自律的に行える点も特徴です。作業結果はスクリーンショットやブラウザ録画を含む「アーティファクト」として構造化され、コードの差分だけでなく作業プロセス全体が追跡可能になります。
ただし、Googleが自ら認めるとおり、Computer Use機能はプレビュー/Pre-GA段階であり「エラーやセキュリティ脆弱性が生じうる」という注意書きが付されています。コミュニティからも「Turboモードに設定しても都度承認を求められる」「MCP呼び出しが無限ローディングに陥る」といった安定性の課題が複数報告されています。
エンタープライズ視点での注意点: エンタープライズティアは展開途上。個人Gmailプレビューが主たる提供形態であり、Antigravity単体でのSOC 2認証、HIPAA/BAA対応、SSO/SAMLサポートについてはGoogleの一次情報源から確認できていません(基盤のGCPインフラはSOC 2 Type II、ISO 27001等を取得済み)。
図1: 3社のAIコーディングエージェント設計思想比較。エンタープライズ成熟度に明確な格差がある。
ベンチマークが示す棲み分け
2026年2〜3月時点の主要ベンチマークスコアは、3社のモデルがそれぞれ異なる領域で強みを持つことを示しています。なお、これらのスコアはエージェント+モデルのシステム全体の性能であり、純粋なモデル能力の比較ではない点に留意が必要です。
| ベンチマーク | Claude Opus 4.6 | GPT-5.3-Codex | Gemini 3.1 Pro | 測定内容 |
|---|---|---|---|---|
| SWE-bench Verified | 80.8% | — | 80.6% | GitHubの実問題解決率(500件の検証済みサブセット) |
| Terminal-Bench 2.0 | 74.7% ± 2.6 | 77.3% ± 2.2 | 78.4% ± 1.8 | ターミナル操作の自律性(エージェントスタック依存) |
| コンテキスト窓(公称) | 200K(1M β) | 400K+ | 1M | 処理可能なトークン数 |
| 実効コンテキスト窓 | ~128K | ~200K | ~64K | 推論精度を維持できる実用範囲 |
Terminal-Bench 2.0のスコアは特定のエージェントスタック(Terminus-KIRA、Droid、Forge Code等)との組み合わせで測定されたものです。同一モデルでもスキャフォールディングが異なれば結果は大きく変動するため、「モデルのベンチマーク」ではなく「エージェントスタックのベンチマーク」として読む必要があります。
スコアから読み取れるパターン
SWE-bench Verified(複雑な推論タスク) では、Claude Opus 4.6とGemini 3.1 Proが80%超でほぼ互角です。一方、Terminal-Bench 2.0(ターミナル操作の自律性) ではGPT-5.3-CodexとGemini 3.1 Proが優位に立ち、Claude Opus 4.6はやや後れを取ります。
つまり、「考える」タスクではClaude、「動く」タスクではCodexとAntigravityという棲み分けが数値上も確認できます。開発者コミュニティのRedditレビューでも、Opus 4.6について「最も『リアルなエンジニア』に近い品質のレポートを生成した」という評価がある一方、Codexは「とにかく速い。Sparkモデルでの生成は魔法のようだ」と評されており、定性的な印象と定量的なスコアが一致しています。
コスト構造の比較
| 項目 | Claude Opus 4.6 | GPT-5.3-Codex | Gemini 3.1 Pro |
|---|---|---|---|
| 入力(per 1Mトークン) | $15.00 | ~$10.00 | $2.00 |
| 出力(per 1Mトークン) | $75.00 | ~$30.00 | $12.00 |
| 個人プラン | Pro $20/月〜Max $200/月 | Plus $20/月〜Pro $200/月 | 無料プレビュー(レート制限あり) |
| エンタープライズAPI | Claude for Enterprise | OpenAI Enterprise | Vertex AI経由 |
API単価ではGemini 3.1 Proが圧倒的に安価であり、Antigravityのプレビュー自体は無料です。しかし後述するとおり、エンタープライズが評価すべきは「トークン単価」ではなく「ガバナンス不在のリスクコスト」です。
エンタープライズ視点での成熟度格差
3つの設計思想の違い以上に、企業のIT部門が注視すべきはエンタープライズ成熟度の格差です。
コンプライアンスと認証
| 要件 | Claude Code | Codex CLI | Antigravity |
|---|---|---|---|
| SOC 2 Type II | ✅ 取得済み | ✅ 取得済み | ⚠️ GCPインフラは取得済み。Antigravity単体は未確認 |
| HIPAA / BAA | ✅ 対応 | ✅ 対応 | ⚠️ GCPの対象サービス範囲内で可能だが、エージェント生成物の扱いに注意 |
| データレジデンシー | ✅ リージョン指定可 | ✅ 対応 | ⚠️ GCPのリージョン管理で対応可能だが、一部展開遅延 |
| SSO / SAML | ✅ 対応 | ✅ 対応 | ⚠️ 未確認(プレビュー段階ではWorkspaceアカウント非対応の報告あり) |
| 監査ログエクスポート | ✅ OpenTelemetry対応 | ✅ セッションログ保持 | ⚠️ Artifact(スクリーンショット・録画)は残るが、SIEM統合は未確認 |
| 組織管理ポリシー | ✅ マネージドCLAUDE.md | ✅ AGENTS.md階層管理 | ⚠️ 展開途上 |
Antigravityの各認証・コンプライアンス項目は、Googleの一次情報源(公式ドキュメント、セキュリティレポート)で「Antigravity」として個別に確認できたものではなく、基盤のGCPインフラの認証に依拠しています。エンタープライズ導入を検討する際は、Googleに対してAntigravity固有の認証範囲を直接確認することを推奨します。
セキュリティ上の構造的リスク
Antigravityの設計思想そのものに、エンタープライズ特有のリスクが内在しています。
Manager Viewのバックグラウンド実行モデルは、エージェントがユーザーの視界外で自律的に動作することを前提としています。セキュリティ研究企業PromptArmorの分析では、この設計によりWebコンテンツ経由のプロンプトインジェクションで、エージェントがローカルの秘密情報を読み取り外部に送信するシナリオが実証されています。
また、Mindgardの研究チームが指摘した「Forced Descent(強制的降下)」脆弱性では、プロジェクト内の .agent ファイルに記述された悪意のある指示が、エージェントのシステム指示への追従性を悪用してグローバル設定ファイルを書き換え、永続的なバックドアを設置できることが報告されました。Googleはこれを「意図された動作」としてクローズしています。
Claude CodeとCodex CLIにもセキュリティリスクは存在しますが、両者はデフォルトの自律度を低く設定し、ユーザーの明示的な承認を求める設計思想を採っています。AntigravityのManager Viewは逆にデフォルトで高い自律度を許容するため、ガバナンスが整備されていない環境では構造的にリスクが増大します。
「無料だから使い始める」— Shadow AIの新たな温床
ここまでの分析を踏まえると、Antigravityがエンタープライズに突きつけている課題の本質が見えてきます。それは**「無料で高機能なツールが、エンタープライズの統制外で使われ始める」**という構造的な問題です。
SonarSourceの2026年調査によれば、AIツールを試した開発者の72%が日常的に利用しており、相当数が個人アカウントでアクセスしています。ここにAntigravityの無料プレビューが加わると、IT部門が把握できないAI利用チャネルがさらに一つ増えることになります。
問題は、Antigravityはプレビュー段階であるがゆえに承認制御やアクセスポリシーの挙動が安定していないことです。Google AI Developer Forumでは「コマンドの許可リストが完全に無視される」「MCP呼び出しの承認プロンプトが表示されず無限ローディングになる」といった報告が2026年2〜3月の時点でも複数上がっています。
企業にとっての意味は明確です。Antigravityは「使うな」と禁止するツールではなく、「いずれ使われる前提でガバナンスを整備すべき」ツールです。
3極化時代に企業が取るべきアクション
3つの異なる設計思想を持つツールが並立する状況で、「どれか1つに統一する」戦略は現実的ではありません。開発者は推論が必要な場面ではClaude Codeを、高速な実装にはCodex CLIを、Google Cloudとの統合にはAntigravityを自然に使い分けるからです。企業に必要なのは、マルチツールを前提としたガバナンス設計です。
アクション1: 指示ファイルの統一運用(Instruction Ops)
3つのツールにはそれぞれ独自の指示ファイル形式があります。
| 指示ファイル | 主導 | 特徴 |
|---|---|---|
| CLAUDE.md | Anthropic | マネージドポリシーの階層配置が可能(組織→プロジェクト→ユーザー) |
| AGENTS.md | オープン標準 | 6万以上のOSSプロジェクトが採用。Codexが「作業前に必ず読む」ファイル |
| Antigravity Skills | TypeScript定義+Markdownの組み合わせ。IDE内で実行可能な「能力」として定義 |
これらは全てMarkdownベースですが、発見ルール(ディスカバリ)やスコープの扱いが異なるため、相互運用にはアダプテーションが必要です。Codex CLIの project_doc_fallback_filenames 設定でフォールバックファイル名を指定できるのは、組織の既存ドキュメントをそのまま利用する現実的なメカニズムとして注目に値します。
企業が取るべき具体的なステップは以下のとおりです。
- リポジトリルートに AGENTS.md を配置し、ツール横断のベースルールとする。AGENTS.mdはオープン標準であり、Claude CodeもCodex CLIも読み込めます
- 組織ポリシーは CLAUDE.md のマネージドパスで配布し、Claude Code利用時のセキュリティルールを中央管理する
- 業務固有のスキルは SKILL.md として構造化し、ツールを超えて再利用可能な知識資産に変換する
- これらの指示ファイルの版管理・レビューフロー・配布戦略を策定する
FirebaseのMCP公式ドキュメントでは、「Firebase agent skills」をAntigravity、Gemini CLI、Claude Code、Cursorなど複数のツールで横断利用する手順が記載されています。Skills+MCPの組み合わせが、ツールチェーン横断の共通パターンとして定着しつつあることを示す好例です。
アクション2: エージェント自律度の段階的ガバナンス
3つのツールはそれぞれ異なるアプローチで「エージェントの自律度」を制御しています。
Claude Codeの2モード:
- Edit Mode(デフォルト): ファイル書き込みとコマンド実行を行うが、重大なアクションの前にユーザー承認を要求
- Auto-accept Mode: CLAUDE.mdでコマンドのホワイトリスト化が可能
Codex CLIの3モード:
- Suggest Mode: 提案のみ
- Auto-Edit Mode: ファイル編集は自動、外部コマンドは都度確認
- Full-Auto Mode: OSレベルのサンドボックスで制御
Antigravityの設定:
- Off / Auto / Turbo の3段階のターミナル実行ポリシー(ただし挙動の安定性に課題あり)
- ブラウザ実行も「常に許可 / 都度確認 / 無効」の3段階
企業は、業務のリスクレベルに応じて各ツールの自律度設定を統一基準で管理する必要があります。例えば「本番環境に影響するリポジトリでは、全ツールで最も保守的なモードを必須とする」というポリシーを策定し、AGENTS.mdやCLAUDE.mdを通じて自動的に適用する仕組みが求められます。
アクション3: FinOps — 無料ツールの隠れコスト
AIコーディングエージェントのFinOps(財務運用管理)は、トークン課金の管理だけでは不十分です。特に「無料」のAntigravityが混在する環境では、**リスクコストを含めた総所有コスト(TCO)**を可視化する必要があります。
直接コスト(トークン / ライセンス):
- Claude Code: OpenTelemetryによるテレメトリエクスポートで、プロジェクト・チーム別のトークン利用量を計測可能
- Codex CLI: セッションログの保持設定(
history.persistence,history.max_bytes)で利用量を管理 - Antigravity: プレビュー期間中は無料だが、エンタープライズ向けの予算管理・利用量エクスポートの仕組みは未確認
間接コスト(リスク・運用):
- 承認制御が不安定なツールの利用調査・インシデント対応コスト
- 複数ツール間でのポリシー整合性維持コスト
- 未承認利用(Shadow AI)の検知・是正コスト
- プレビュー段階のツールで構築されたプロトタイプの本番化リワークコスト
図2: 3極化時代のマルチツール・ガバナンスアーキテクチャ。組織ポリシー → 指示ファイル → スキル層 → FinOpsの4層で統制する。
「ツール選定」から「ツール統制」へ
2026年のAIコーディングエージェント市場は、もはや「どのツールを選ぶか」という問いの段階を過ぎています。開発者はすでに複数のツールを状況に応じて使い分けており、Stack Overflowの2025年調査で開発者の84%がAIツールを利用中という数字は、この流れが不可逆であることを示しています。
同時に、Gartnerが予測する「2028年までに75%のエンタープライズ開発者がAIコードアシスタントを利用する」という未来は、もはや予測ではなく現実です。問いは「導入するか否か」から、**「どう統制するか」**に完全に移行しました。
Claude Codeは推論の質とガバナンス成熟度で最も信頼性の高い選択肢です。Codex CLIは実行速度とオープンな標準でCI/CDパイプラインとの統合に適しています。Antigravityはマルチエージェントのオーケストレーションという独自のビジョンを持ちますが、エンタープライズ成熟度の検証が不可欠です。
企業に求められるのは、単一ツールの選定ではなく、これら3つ(さらにはCursor、Copilot、Cline等を含む)のツール群を組織として安全に、かつ生産的に運用するためのガバナンス基盤の構築です。IT部門の役割はゲートキーパー(門番)からイネーブラー(促進者)へと転換し、柔軟なツール採用を許容しつつも統制可能な仕組みを整えることが求められます。
homulaのAIコーディングエージェント導入支援(Phase 0-Dev)は、CLAUDE.md / AGENTS.md / SKILL.mdの組織標準化から、マルチツール環境のガバナンス設計、FinOps構築、採用定着支援までを1〜4週間で提供します。FDE(Forward Deployed Engineer)が1〜2名で、コンサルティングと実装を一気通貫で完結させます。