I/O 2026が示した「エージェント前提」への移行
homulaは、エンタープライズ企業向けにAIエージェントの戦略策定からPoC・実装・運用・内製化までを支援するAIインテグレーターです。
2026年5月のGoogle I/Oは、ひとことで言えば**「チャットからエージェントへ」の宣言**でした。Googleは新モデルから開発者基盤、エンドユーザー機能までを「エージェントが前提で動く」設計に揃えてきました(Google: I/O 2026)。CEOのスンダー・ピチャイ氏は「AIサイクルの中で、人々が日々使う製品に価値を見たいと考える段階に入った」と述べ、研究成果を実用に落とす局面であることを強調しています。
発表は数十項目に及び、消費者向けの華やかな機能も多く含まれます。本記事はその全リストをなぞるのではなく、日本のエンタープライズが本当に見るべき3点——開発者向けのManaged Agents、エンドユーザー向けのSpark、そしてコスト戦略——に絞って、一次情報から読み解きます。
まず数字——Geminiはどれだけ使われているか
エージェント論の前提として、利用規模の桁が変わっています。Googleの発表によれば、月間の処理トークンは1年で約7倍に増えました。
ほかにも、Googleのモデルで開発する開発者は月間850万人、API処理は毎分約190億トークン、過去12か月で1兆トークン超を処理したGoogle Cloud顧客は375社以上、と報告されています。設備投資(capex)も2022年の約310億ドルから2026年は1,800〜1,900億ドル規模へ拡大しています。「実験的に試す」段階は終わり、基盤として日常的に消費される——この前提に立って各発表を見ると、本質が見えてきます。
開発者向け:Managed Agents in the Gemini API
エンタープライズにとって最も重要なのは、Managed Agents in the Gemini API です(Google: Managed Agents)。これは、エージェントが推論し・ツールを使い・コードを実行するための隔離されたLinux環境を、1回のAPI呼び出しで用意できる仕組みです。
これまで本番品質のエージェントを作るには、サンドボックス(隔離実行環境)の構築と運用、足場(scaffolding)の管理といった複雑なインフラ作業が必要でした。Managed Agentsはそこを肩代わりし、開発者はエージェントの振る舞いと製品体験に集中できます。
注目すべきは、カスタムエージェントを AGENTS.md と SKILL.md(マークダウンのファイル)で定義する点です。これはAnthropic系のエージェント設計で広がった作法で、Googleもこの“共通語”を採用したことになります。エージェント設計のスキルが特定ベンダーに閉じず、移植しやすくなる方向です。
主な特徴は次のとおりです。
- 隔離Linux環境でのコード実行・ファイル管理・Web閲覧
- セッションの再開(ファイルや状態を保持したまま続きを実行)
- 基盤モデルは Gemini 3.5 Flash、Interactions API と Google AI Studio から利用
- 企業向けには Gemini Enterprise Agent Platform 経由で提供
- Ramp、ResembleAI、Klipy、Stitch などが先行利用
ここでGoogleが解いている課題は、homulaが日々向き合うものと同じです。エージェントを「動かす」こと自体より、安全な実行環境・状態管理・ツール接続という運用基盤が成否を分ける、という認識です。
エンドユーザー向け:Gemini Spark とMCP接続
もう一方の軸が、エンドユーザー向けの Gemini Spark です(Google: Geminiアプリの進化)。Sparkは24時間365日バックグラウンドで動く個人向けエージェントで、Gmail・ドキュメントなどWorkspaceを横断してタスクを進めます。端末がロック中でも動作し、定期タスクの設定やカスタムスキルの学習、複数ステップのワークフロー実行ができます。「Daily Brief」は、メールやカレンダーから要点をまとめた朝のダイジェストを届けます。
エンタープライズの視点で見逃せないのが2点あります。ひとつは、Sparkが外部サービスへの接続に MCP(Model Context Protocol) を使い、Canva・OpenTable・Instacartなどとつながること。消費者向けエージェントですら、ツール接続の“配線”を独自実装ではなくMCPという共通規格で行う流れが鮮明になりました。もうひとつは、送金やメール送信のような高リスクな行動の前に必ず許可を求める設計です。これは企業のエージェント設計で必須となる「人間による承認(Human-in-the-Loop)」が、消費者プロダクトにも標準装備された、ということです。
エンタープライズが見るべき3点
華やかな発表群を、企業の判断材料として圧縮すると次の3点になります。
| 論点 | I/O 2026での示唆 | 企業が確認すべきこと |
|---|---|---|
| コスト | Gemini 3.5 Flashは「フロンティア級を低コストで」を掲げる | エージェントは大量にトークンを消費する。用途ごとにモデルを使い分け、単価とのバランスを設計する |
| 標準 | Managed AgentsもSparkもMCPを採用 | ツール接続をベンダー独自実装で積まず、MCPで共通化して移植性を確保する |
| 権限 | 高リスク行動は許可制が前提 | どの操作を自律実行させ、どこで人が承認するかを先に決める |
Gemini 3.5 Flashについて、Googleは「ワークロードの8割を移せば年間10億ドル超を節約できる規模」と試算を示しています。これはGoogle自身の主張ですが、エージェント運用の最大のコストはモデル呼び出しに集中するという構造を端的に表しています。
homulaの観点
Googleが示したのは、特定ベンダーの優劣ではなく、エージェント時代の“標準的な部品”が出揃ったという事実です。隔離実行環境、MCPによるツール接続、許可制のガバナンス——どれもhomulaがエンタープライズ導入で重視してきた要素と一致します。
homulaの支援では、ツール接続は Agens(MCPを活用し200以上のツールと構築ゼロで接続)が担い、Googleが示した「MCPで共通化する」流れにそのまま乗れます。承認・監査の部分は Agens Control(承認フロー・DLP・5年分の監査ログ・RBAC)が担い、「高リスク行動は許可制」という設計原則を、エンタープライズの統制要件に合わせて実装します。重要なのは、特定クラウドに縛られず、自社の業務とデータの所在に合わせてこれらの部品を組み合わせることです。
I/Oの発表に煽られて全部入れる必要はありません。コスト・標準・権限の3点を自社の言葉で定義し、まず1業務で回す——それが、流行に振り回されない現実的な進め方です。
まとめ
Google I/O 2026は、モデル・開発者基盤・エンドユーザー機能のすべてを「エージェント前提」に揃えた点で象徴的でした。Managed Agentsは隔離実行環境を、Sparkは24/7のエンドユーザーエージェントを、Gemini 3.5 Flashは低コスト化を打ち出しています。
しかし企業が見るべきは新機能の数ではなく、その裏で標準化が進んだコスト設計・MCPによる接続・許可制のガバナンスです。マルチエージェントの全体像についてはマルチエージェント・オーケストレーションの記事も合わせてご覧ください。流行の表層ではなく、こうした“土台の共通化”を自社の設計にどう取り込むかが、2026年後半の分かれ目になります。
各社のエージェント基盤が出揃ったいま、重要なのは「どれを選ぶか」より「自社の業務にどう組み込むか」です。コスト・接続・権限を自社要件で設計するところから始めませんか。