Agent Skillsとは何か
AIエージェントに再利用可能な専門知識を持たせる仕組み——その課題背景、設計思想、アーキテクチャの全体像を解説します。
Definition
Agent Skills(エージェントスキル)とは、指示・スクリプト・リソースをフォルダにまとめ、AIエージェントが必要な時に必要な分だけ読み込む仕組みです。2025年にAnthropicが開発し、オープン標準として公開されたフォーマットで、Claude、Cursor、GitHub Copilot、VS Code、OpenAI Codexなど主要なAIツールが採用しています。
なぜSkillsが必要なのか
Claudeのような大規模言語モデル(LLM)は汎用的に優秀ですが、実務で使い込むほど3つの構造的な壁にぶつかります。Skillsはこれらの課題に対する統一的な解決策として設計されました。
まず、それぞれの課題を具体的に見ていきましょう。
Challenges
AIエージェントが直面する3つの課題
反復の非効率さ
毎週の売上レポートをClaudeに依頼する場面を考えてください。初回は「Excel形式で、ヘッダーはゴシック体14ptの太字、列幅は自動調整、合計行にはSUM関数を…」と丁寧に指示して、期待通りの出力が得られます。ところが翌週、同じ依頼をすると、Claudeは前回の会話を覚えていません。
これは、AIに会話をまたいだ「手続き的記憶」——つまり「こういうタスクにはこう対応する」という手順レベルの知識——が存在しないためです。人間の同僚なら一度教えれば覚えてくれることが、AIでは10回目でも初回とまったく同じ説明をゼロからやり直す必要があります。
コンテキストの圧迫
指示が長大化すると別の問題が浮上します。Claudeには「コンテキストウィンドウ」と呼ばれる、一度に扱える情報量の上限があります。本で例えるなら、Claudeが一度に開けるページ数には限りがあるようなもので、指示書で大量のページを使ってしまうと、ユーザーの質問や作業データに使えるページが減ります。
Excelの書式ルール、APIの仕様書、ブランドガイドライン——これらすべてを毎回プロンプトに詰め込むのは非現実的です。指示が増えるほど肝心のタスクに使える余地が圧迫され、出力品質が低下するリスクすらあります。
品質の属人化
チームでClaudeを使う場合、さらに深刻な問題があります。Aさんが試行錯誤の末に編み出した高品質なプロンプトは、Aさんの頭の中にしか存在しません。Bさんが似た依頼をしても、指示の書き方が異なるため、まったく違う形式・品質の出力になります。
個人の暗黙知がチームの資産にならない——プロンプトエンジニアリングの知識が口頭伝承のように散逸してしまう構造的な問題です。
| 課題 | Skillsの解決策 | 具体例 |
|---|---|---|
| 反復の非効率さ | 再利用性— 一度作れば何度でも使える | PDF処理スキルを全プロジェクトで共有 |
| コンテキストの圧迫 | 効率性— 必要な知識だけを動的に読み込む | 100個のスキルがあっても未使用分はトークン消費ゼロ |
| 品質の属人化 | 一貫性— 誰が使っても同じ品質の出力 | ブランドガイドラインに沿った資料を常に作成 |
Structure
Skillの構成要素
Skillsの参入障壁は極めて低く、Markdownファイル1つから始められます。必要に応じてスクリプトやリファレンスを追加し、段階的に拡張できる設計です。
最小構成 — SKILL.mdファイル1つだけ
my-skill/ └── SKILL.md # これだけで立派なSkill
SKILL.mdは、YAMLフロントマター(メタデータ)とMarkdown本文(指示)の2パートで構成されます。nameとdescriptionの2フィールドだけが必須です。
# SKILL.md の基本構造
--- name: pdf-processing description: Extract text and tables from PDF files, fill forms, merge documents. Use when working with PDF documents or when the user mentions PDFs. --- # PDF Processing ## テキスト抽出の手順 1. pdfplumberを使用してテキストを抽出... ## フォーム入力 ...
フル構成 — 補助ファイルで機能を拡張
my-skill/ ├── SKILL.md # 【必須】メタデータ + 指示 ├── scripts/ # 【任意】実行可能なコード ├── references/ # 【任意】詳細ドキュメント └── assets/ # 【任意】テンプレート・静的リソース
| ディレクトリ | 役割 | ファイル例 |
|---|---|---|
scripts/ | Claudeが実行するコード | validate_form.py, extract_text.py |
references/ | 必要時に読み込む詳細資料 | finance_tables.md, api_spec.md |
assets/ | テンプレートや静的ファイル | report_template.docx, config.json |
Key Point
補助ファイルは存在するだけではトークンを一切消費しません。Claudeが実際に読み込んだファイルだけがコンテキストウィンドウに入ります。この仕組みが、Skillsのスケーラビリティを支えています。
Core Design
段階的開示(Progressive Disclosure)— Skillsの核心設計
Skillsの最も重要な設計原則が「段階的開示」です。全てのSkillを最初から読み込むのではなく、本の目次と同じ発想で、まず目次だけを見せ、必要な章だけを開きます。
仮に50個のSkillをインストールしていて、各Skillの全内容が平均5,000トークンだとすると、起動時に全てを読み込めば25万トークンを消費します。これではユーザーの質問や作業データに使える余地がほとんど残りません。
3つのレベル
Level 1: Discovery(発見)
起動時・常時全Skillのnameとdescriptionのみをシステムプロンプトに注入。1 Skillあたり約50〜100トークンのコスト。
Level 2: Activation(有効化)
タスクとの一致を検出した時SKILL.md本文(指示全体)を読み込み。使用すべきライブラリ、手順、エッジケースへの対処法などの詳細な指示がコンテキストに入る。
Level 3: Execution(実行)
指示内で参照された時のみscripts/、references/、assets/ の補助ファイルを選択的に読み込み・実行。不要なファイルは一切コンテキストに入らない。
50-100x
トークン効率化
~10K
100 Skillsの起動コスト(トークン)
0
未使用Skillのトークン消費
コンテキストウィンドウの変化を視覚化
【起動時】
System Prompt
Skill A
name + desc
Skill B
name + desc
Skill C
name + desc
~300トークン
メタデータのみ
【タスク検出時】
System Prompt
Skill A
SKILL.md 全文を展開
Skill B
name + desc
Skill C
name + desc
~5,300トークン
Skill A を展開
【実行時】
System Prompt
Skill A
SKILL.md 全文
+ refs/data 読み込み
Skill B
name + desc
Skill C
name + desc
~5,300+α トークン
参照ファイル追加
起動時にはメタデータだけが注入され、タスクに応じて必要なSkillだけが段階的に展開される。使わないSkillはコンテキストウィンドウに一切入らない。
Example
具体例:PDF処理スキルの読み込みフロー
段階的開示の動作を、PDF処理スキルを使った具体的なシナリオで追ってみましょう。
起動時:メタデータの自動注入
システムプロンプトに全Skillのメタデータが自動的に注入されます。
<available_skills>
<skill>
<name>pdf-processing</name>
<description>Extract text and tables from
PDF files, fill forms, merge documents.
</description>
<location>/path/to/skills/pdf/SKILL.md</location>
</skill>
<!-- 他のSkillも同様に列挙 -->
</available_skills>「このPDFからテキストを抽出して要約して」
Claudeは全Skillのdescriptionをスキャンし、「PDF」「抽出」といったキーワードからpdf-processingスキルとの関連を検出します。
SKILL.md全文の読み込み
Claudeがbashコマンドを発行してSKILL.md全文を読み込みます。
cat /path/to/skills/pdf-processing/SKILL.md
不要なファイルはスキップ
SKILL.mdにはreferences/FORMS.md(フォーム入力の詳細手順)への参照がありますが、今回のタスクはテキスト抽出なのでClaudeはこれを読み込みません。使わないファイルのトークンコストはゼロです。
スクリプト実行と結果取得
SKILL.mdの指示に従い、Claudeがスクリプトを実行します。
python /path/to/skills/pdf/scripts/extract_text.py input.pdf
Key Point
スクリプトのソースコード自体はコンテキストウィンドウに入りません。入るのは実行結果(stdout/stderr)のみです。1,000行のPythonスクリプトでも、コンテキストに入るのは「Extracted 15 pages, 4,230 words」のような出力だけです。
Architecture
アーキテクチャの要点
ファイルシステムベース
SkillsはVM上のディレクトリとして存在し、Claudeはbashコマンド(cat、ls等)でアクセス。特別なAPIやSDKは不要。
スクリプト実行の効率性
コード自体はコンテキストに入らず、実行結果のみが入る。決定論的な処理により再現性のあるワークフローを構築可能。
バンドル量に制限なし
使わないファイルはトークンゼロ。大量のAPIドキュメントやテンプレートをバンドルして必要時だけ参照する運用が可能。
コンピュータの構成要素とのアナロジー
プロセッサ
LLM(Claude等)
考える力
OS
エージェントランタイム
実行環境
アプリ
Skills
専門的なアプリケーション
Anthropic公式ドキュメントには「ファイルシステムとコード実行ツールを持つエージェントは、Skillの全内容をコンテキストウィンドウに読み込む必要がない」と明記されています。この特性が、Skillsのスケーラビリティを支えています。
Ecosystem
オープン標準としてのSkills
Agent Skillsは2025年にAnthropicが開発し、同年12月にオープン標準として公開されました。これにより、Claude専用の機能ではなく、AIエコシステム全体で使える共通フォーマットとなっています。
| カテゴリ | 採用ツール |
|---|---|
| Claude製品群 | Claude.ai、Claude Code、Claude Agent SDK |
| コードエディタ | Cursor、VS Code、GitHub Copilot |
| その他のAIツール | OpenAI Codex、Amp、Goose、Letta、OpenCode |
View Source のアナロジー
Tim O'Reillyはこの設計を、初期のWebにおける「View Source」に例えています。誰でもSkillの中身を読み、理解し、フォークし、改良できる。このオープンな参加型アーキテクチャが、GPTsのようなクローズドなアプリストア型アプローチとは根本的に異なる点です。
Security
セキュリティの基本
Skillsはスクリプト実行を含むため、信頼できるソースからのみ使用するのが原則です。自作のSkill、またはAnthropic公式のプリビルトSkillであれば安全ですが、第三者が作成したSkillは使用前にレビューしてください。
チェックすべきリスク指標: コード実行(scripts/内のファイルはVM上でフルアクセス権限を持つ)、ネットワークアクセス(URL、APIコール、curl/fetch等)、ファイルシステムへの広範なアクセス、ハードコードされた認証情報、安全ルールの無視を指示する記述。
セキュリティレビューの詳細な手順と、エンタープライズ環境での運用については、Part 5: 実践ガイドで詳しく解説しています。
Summary
まとめ
Agent Skillsは「AIエージェント向けの再利用可能な専門知識パッケージ」であり、反復の非効率さ・コンテキストの圧迫・品質の属人化という3つの課題を解決する
SKILL.mdファイル1つから始められるシンプルな構造で、参入障壁が極めて低い
段階的開示(Progressive Disclosure)により、Discovery → Activation → Executionの3レベルで50〜100倍のトークン効率化を実現する
ファイルシステムベースの設計により、特別なAPIなしで動作する。スクリプト実行時もコード自体はコンテキストに入らない
オープン標準として、Claude以外の主要AIツール(Cursor、GitHub Copilot、VS Code、OpenAI Codex等)でも利用可能
Support
homulaのAIエージェント導入支援
homulaは、Skills設計を含むAIエージェントの戦略策定・PoC・実装・運用までを一気通貫で支援しています。特定ツールに縛られず、要件に応じて最適な技術を組み合わせる「コンポーザブルAIアーキテクト」として、400社超の支援実績があります。
FAQ
よくある質問
いいえ。Agent Skillsは2025年にAnthropicが開発し、オープン標準として公開されたフォーマットです。Claude製品群(Claude.ai、Claude Code、Claude Agent SDK)に加え、Cursor、VS Code、GitHub Copilot、OpenAI Codexなど主要なAIツールが採用しています。一度作ったSkillを複数プラットフォームで再利用できます。
不要です。SKILL.mdというMarkdownファイルを1つ作成するだけで始められます。YAMLフロントマターにnameとdescriptionの2フィールドを記述し、本文にMarkdownで指示を書くだけです。特別なAPIやSDKは不要で、テキストエディタがあればすぐに作れます。
Skillsの核心設計で、全ての知識を最初から読み込まず、3段階に分けて必要な分だけ読み込む仕組みです。Level 1(Discovery)で名前と説明文だけを認識し、Level 2(Activation)でタスクに合致したSkillの本文を読み込み、Level 3(Execution)で参照ファイルやスクリプトを使います。100個のSkillがあっても、50〜100倍のトークン効率化を実現します。
システムプロンプトは会話ごとに毎回全文がコンテキストに入り、会話をまたいだ再利用ができません。Skillsは一度作れば永続的に利用でき、段階的開示により必要な部分だけを動的に読み込みます。また、scripts/やreferences/を含むリッチな構成が可能で、チーム全体で共有できます。
Skillsにはスクリプト実行機能があるため、信頼できるソースからのみ利用するのが原則です。第三者が作成したSkillは、コード実行、ネットワークアクセス、ファイルシステムへのアクセス範囲を事前にレビューしてください。自作またはAnthropic公式のプリビルトSkillであれば安全です。詳細なセキュリティレビュー手順はPart 5で解説しています。