homula
Claude Skills入門 — Part 1

Agent Skillsとは何か

AIエージェントに再利用可能な専門知識を持たせる仕組み——その課題背景、設計思想、アーキテクチャの全体像を解説します。

読了目安: 15分最終更新: 2025年2月

Definition

Agent Skills(エージェントスキル)とは、指示・スクリプト・リソースをフォルダにまとめ、AIエージェントが必要な時に必要な分だけ読み込む仕組みです。2025年にAnthropicが開発し、オープン標準として公開されたフォーマットで、Claude、Cursor、GitHub Copilot、VS Code、OpenAI Codexなど主要なAIツールが採用しています。

なぜSkillsが必要なのか

Claudeのような大規模言語モデル(LLM)は汎用的に優秀ですが、実務で使い込むほど3つの構造的な壁にぶつかります。Skillsはこれらの課題に対する統一的な解決策として設計されました。

まず、それぞれの課題を具体的に見ていきましょう。

Challenges

AIエージェントが直面する3つの課題

反復の非効率さ

毎週の売上レポートをClaudeに依頼する場面を考えてください。初回は「Excel形式で、ヘッダーはゴシック体14ptの太字、列幅は自動調整、合計行にはSUM関数を…」と丁寧に指示して、期待通りの出力が得られます。ところが翌週、同じ依頼をすると、Claudeは前回の会話を覚えていません。

これは、AIに会話をまたいだ「手続き的記憶」——つまり「こういうタスクにはこう対応する」という手順レベルの知識——が存在しないためです。人間の同僚なら一度教えれば覚えてくれることが、AIでは10回目でも初回とまったく同じ説明をゼロからやり直す必要があります。

コンテキストの圧迫

指示が長大化すると別の問題が浮上します。Claudeには「コンテキストウィンドウ」と呼ばれる、一度に扱える情報量の上限があります。本で例えるなら、Claudeが一度に開けるページ数には限りがあるようなもので、指示書で大量のページを使ってしまうと、ユーザーの質問や作業データに使えるページが減ります。

Excelの書式ルール、APIの仕様書、ブランドガイドライン——これらすべてを毎回プロンプトに詰め込むのは非現実的です。指示が増えるほど肝心のタスクに使える余地が圧迫され、出力品質が低下するリスクすらあります。

品質の属人化

チームでClaudeを使う場合、さらに深刻な問題があります。Aさんが試行錯誤の末に編み出した高品質なプロンプトは、Aさんの頭の中にしか存在しません。Bさんが似た依頼をしても、指示の書き方が異なるため、まったく違う形式・品質の出力になります。

個人の暗黙知がチームの資産にならない——プロンプトエンジニアリングの知識が口頭伝承のように散逸してしまう構造的な問題です。

課題Skillsの解決策具体例
反復の非効率さ再利用性— 一度作れば何度でも使えるPDF処理スキルを全プロジェクトで共有
コンテキストの圧迫効率性— 必要な知識だけを動的に読み込む100個のスキルがあっても未使用分はトークン消費ゼロ
品質の属人化一貫性— 誰が使っても同じ品質の出力ブランドガイドラインに沿った資料を常に作成

Structure

Skillの構成要素

Skillsの参入障壁は極めて低く、Markdownファイル1つから始められます。必要に応じてスクリプトやリファレンスを追加し、段階的に拡張できる設計です。

最小構成 — SKILL.mdファイル1つだけ

my-skill/
└── SKILL.md          # これだけで立派なSkill

SKILL.mdは、YAMLフロントマター(メタデータ)とMarkdown本文(指示)の2パートで構成されます。namedescriptionの2フィールドだけが必須です。

# SKILL.md の基本構造

---
name: pdf-processing
description: Extract text and tables from PDF files,
  fill forms, merge documents. Use when working with
  PDF documents or when the user mentions PDFs.
---

# PDF Processing

## テキスト抽出の手順
1. pdfplumberを使用してテキストを抽出...

## フォーム入力
...

フル構成 — 補助ファイルで機能を拡張

my-skill/
├── SKILL.md          # 【必須】メタデータ + 指示
├── scripts/          # 【任意】実行可能なコード
├── references/       # 【任意】詳細ドキュメント
└── assets/           # 【任意】テンプレート・静的リソース
ディレクトリ役割ファイル例
scripts/Claudeが実行するコードvalidate_form.py, extract_text.py
references/必要時に読み込む詳細資料finance_tables.md, api_spec.md
assets/テンプレートや静的ファイルreport_template.docx, config.json

Key Point

補助ファイルは存在するだけではトークンを一切消費しません。Claudeが実際に読み込んだファイルだけがコンテキストウィンドウに入ります。この仕組みが、Skillsのスケーラビリティを支えています。

Core Design

段階的開示(Progressive Disclosure)— Skillsの核心設計

Skillsの最も重要な設計原則が「段階的開示」です。全てのSkillを最初から読み込むのではなく、本の目次と同じ発想で、まず目次だけを見せ、必要な章だけを開きます。

仮に50個のSkillをインストールしていて、各Skillの全内容が平均5,000トークンだとすると、起動時に全てを読み込めば25万トークンを消費します。これではユーザーの質問や作業データに使える余地がほとんど残りません。

3つのレベル

1

Level 1: Discovery(発見)

起動時・常時

全Skillのnamedescriptionのみをシステムプロンプトに注入。1 Skillあたり約50〜100トークンのコスト。

100 Skills → 約5,000〜10,000トークン
2

Level 2: Activation(有効化)

タスクとの一致を検出した時

SKILL.md本文(指示全体)を読み込み。使用すべきライブラリ、手順、エッジケースへの対処法などの詳細な指示がコンテキストに入る。

推奨サイズ: 5,000トークン未満/Skill
3

Level 3: Execution(実行)

指示内で参照された時のみ

scripts/、references/、assets/ の補助ファイルを選択的に読み込み・実行。不要なファイルは一切コンテキストに入らない。

使わないファイル → トークンコストゼロ

50-100x

トークン効率化

~10K

100 Skillsの起動コスト(トークン)

0

未使用Skillのトークン消費

コンテキストウィンドウの変化を視覚化

【起動時】

System Prompt

Skill A

name + desc

Skill B

name + desc

Skill C

name + desc

~300トークン

メタデータのみ

【タスク検出時】

System Prompt

Skill A

SKILL.md 全文を展開

Skill B

name + desc

Skill C

name + desc

~5,300トークン

Skill A を展開

【実行時】

System Prompt

Skill A

SKILL.md 全文

+ refs/data 読み込み

Skill B

name + desc

Skill C

name + desc

~5,300+α トークン

参照ファイル追加

起動時にはメタデータだけが注入され、タスクに応じて必要なSkillだけが段階的に展開される。使わないSkillはコンテキストウィンドウに一切入らない。

Example

具体例:PDF処理スキルの読み込みフロー

段階的開示の動作を、PDF処理スキルを使った具体的なシナリオで追ってみましょう。

Step 1 — Discovery

起動時:メタデータの自動注入

システムプロンプトに全Skillのメタデータが自動的に注入されます。

<available_skills>
  <skill>
    <name>pdf-processing</name>
    <description>Extract text and tables from
      PDF files, fill forms, merge documents.
    </description>
    <location>/path/to/skills/pdf/SKILL.md</location>
  </skill>
  <!-- 他のSkillも同様に列挙 -->
</available_skills>
Step 2 — ユーザーの依頼

「このPDFからテキストを抽出して要約して」

Claudeは全Skillのdescriptionをスキャンし、「PDF」「抽出」といったキーワードからpdf-processingスキルとの関連を検出します。

Step 3 — Activation

SKILL.md全文の読み込み

Claudeがbashコマンドを発行してSKILL.md全文を読み込みます。

cat /path/to/skills/pdf-processing/SKILL.md
Step 4 — 判断と選択的読み込み

不要なファイルはスキップ

SKILL.mdにはreferences/FORMS.md(フォーム入力の詳細手順)への参照がありますが、今回のタスクはテキスト抽出なのでClaudeはこれを読み込みません。使わないファイルのトークンコストはゼロです。

Step 5 — Execution

スクリプト実行と結果取得

SKILL.mdの指示に従い、Claudeがスクリプトを実行します。

python /path/to/skills/pdf/scripts/extract_text.py input.pdf

Key Point

スクリプトのソースコード自体はコンテキストウィンドウに入りません。入るのは実行結果(stdout/stderr)のみです。1,000行のPythonスクリプトでも、コンテキストに入るのは「Extracted 15 pages, 4,230 words」のような出力だけです。

Architecture

アーキテクチャの要点

ファイルシステムベース

SkillsはVM上のディレクトリとして存在し、Claudeはbashコマンド(cat、ls等)でアクセス。特別なAPIやSDKは不要。

スクリプト実行の効率性

コード自体はコンテキストに入らず、実行結果のみが入る。決定論的な処理により再現性のあるワークフローを構築可能。

バンドル量に制限なし

使わないファイルはトークンゼロ。大量のAPIドキュメントやテンプレートをバンドルして必要時だけ参照する運用が可能。

コンピュータの構成要素とのアナロジー

プロセッサ

LLM(Claude等)

考える力

OS

エージェントランタイム

実行環境

アプリ

Skills

専門的なアプリケーション

Anthropic公式ドキュメントには「ファイルシステムとコード実行ツールを持つエージェントは、Skillの全内容をコンテキストウィンドウに読み込む必要がない」と明記されています。この特性が、Skillsのスケーラビリティを支えています。

Ecosystem

オープン標準としてのSkills

Agent Skillsは2025年にAnthropicが開発し、同年12月にオープン標準として公開されました。これにより、Claude専用の機能ではなく、AIエコシステム全体で使える共通フォーマットとなっています。

カテゴリ採用ツール
Claude製品群Claude.ai、Claude Code、Claude Agent SDK
コードエディタCursor、VS Code、GitHub Copilot
その他のAIツールOpenAI Codex、Amp、Goose、Letta、OpenCode

View Source のアナロジー

Tim O'Reillyはこの設計を、初期のWebにおける「View Source」に例えています。誰でもSkillの中身を読み、理解し、フォークし、改良できる。このオープンな参加型アーキテクチャが、GPTsのようなクローズドなアプリストア型アプローチとは根本的に異なる点です。

Security

セキュリティの基本

Skillsはスクリプト実行を含むため、信頼できるソースからのみ使用するのが原則です。自作のSkill、またはAnthropic公式のプリビルトSkillであれば安全ですが、第三者が作成したSkillは使用前にレビューしてください。

チェックすべきリスク指標: コード実行(scripts/内のファイルはVM上でフルアクセス権限を持つ)、ネットワークアクセス(URL、APIコール、curl/fetch等)、ファイルシステムへの広範なアクセス、ハードコードされた認証情報、安全ルールの無視を指示する記述。

セキュリティレビューの詳細な手順と、エンタープライズ環境での運用については、Part 5: 実践ガイドで詳しく解説しています。

Summary

まとめ

1

Agent Skillsは「AIエージェント向けの再利用可能な専門知識パッケージ」であり、反復の非効率さ・コンテキストの圧迫・品質の属人化という3つの課題を解決する

2

SKILL.mdファイル1つから始められるシンプルな構造で、参入障壁が極めて低い

3

段階的開示(Progressive Disclosure)により、Discovery → Activation → Executionの3レベルで50〜100倍のトークン効率化を実現する

4

ファイルシステムベースの設計により、特別なAPIなしで動作する。スクリプト実行時もコード自体はコンテキストに入らない

5

オープン標準として、Claude以外の主要AIツール(Cursor、GitHub Copilot、VS Code、OpenAI Codex等)でも利用可能

Support

homulaのAIエージェント導入支援

homulaは、Skills設計を含むAIエージェントの戦略策定・PoC・実装・運用までを一気通貫で支援しています。特定ツールに縛られず、要件に応じて最適な技術を組み合わせる「コンポーザブルAIアーキテクト」として、400社超の支援実績があります。

FAQ

よくある質問

いいえ。Agent Skillsは2025年にAnthropicが開発し、オープン標準として公開されたフォーマットです。Claude製品群(Claude.ai、Claude Code、Claude Agent SDK)に加え、Cursor、VS Code、GitHub Copilot、OpenAI Codexなど主要なAIツールが採用しています。一度作ったSkillを複数プラットフォームで再利用できます。

不要です。SKILL.mdというMarkdownファイルを1つ作成するだけで始められます。YAMLフロントマターにnameとdescriptionの2フィールドを記述し、本文にMarkdownで指示を書くだけです。特別なAPIやSDKは不要で、テキストエディタがあればすぐに作れます。

Skillsの核心設計で、全ての知識を最初から読み込まず、3段階に分けて必要な分だけ読み込む仕組みです。Level 1(Discovery)で名前と説明文だけを認識し、Level 2(Activation)でタスクに合致したSkillの本文を読み込み、Level 3(Execution)で参照ファイルやスクリプトを使います。100個のSkillがあっても、50〜100倍のトークン効率化を実現します。

システムプロンプトは会話ごとに毎回全文がコンテキストに入り、会話をまたいだ再利用ができません。Skillsは一度作れば永続的に利用でき、段階的開示により必要な部分だけを動的に読み込みます。また、scripts/やreferences/を含むリッチな構成が可能で、チーム全体で共有できます。

Skillsにはスクリプト実行機能があるため、信頼できるソースからのみ利用するのが原則です。第三者が作成したSkillは、コード実行、ネットワークアクセス、ファイルシステムへのアクセス範囲を事前にレビューしてください。自作またはAnthropic公式のプリビルトSkillであれば安全です。詳細なセキュリティレビュー手順はPart 5で解説しています。

AIエージェントの導入を始めませんか?

homulaは、Skills設計を含むAIエージェント構築を5日間のブートキャンプから支援しています。まずはお気軽にご相談ください。