homula
Document AI Agent — 最新マルチモーダルLLM × Agent Skills

AIは今、
手書きを「読む」のではなく、
「理解する」。

homulaのDocument AI Agentは、最新マルチモーダルLLMの文書理解能力を活用し、手書き・スキャン・複雑レイアウトを含む帳票・文書の読み取りから転記・照合・承認フローまでをAIエージェントが自律実行する、エンタープライズ向けエンドツーエンド文書処理サービスです。

「AIに手書きは無理」は、もう過去の話です。請求書・発注書・契約書・手書き申請書・検査帳票など幅広い文書種別に対応。最短2週間でPoC開始。

DOCUMENT AI AGENT PIPELINE

文書受領
スキャン
LLM文
情報抽出
業務ルー
例外判定
後工程連

従来OCRは②〜③まで / homulaは②〜⑦をAIエージェントが自律実行

Live Demo

あらゆる文書・帳票で、
AIエージェントの処理を確認してください。

5種類の文書タブを切り替えて「処理を実行する」をクリック。 手書き点検票・CAD図面・図面シンボル・FAXなど、 従来OCRが苦手とした文書をLLMがどう処理するかを確認できます。

製造・設備管理
手書き点検票 サンプル

「処理を実行する」をクリックしてデモを開始 →

※ デモ用シミュレーションです。実際の処理はお客様文書に合わせて設計します。

Next Step

貴社の帳票種別・精度をPoCで検証する

手書き・非定型・CAD図面など、従来OCRで諦めていた文書を対象に最短2週間で検証します。

Intelligence

「読む」OCRから、
「理解する」AIへ。

多くの方がまだご存知ないかもしれませんが、最新のマルチモーダルLLMは従来のOCRとは根本的に異なります。文字を「検出」するのではなく、文書の「意味」を理解します。

TRADITIONAL OCR

文字を「検出」する

ピクセルパターンからテキストを抽出する処理。テンプレートに依存し、レイアウト変化や手書きに脆弱。認識した文字列の「意味」は理解しない。

MULTIMODAL LLM

文書を「理解」する

文書全体を視覚的に把握し、レイアウト構造・文脈・意味を同時に処理。手書きの崩し字も周辺情報から補完。「何が書かれているか」だけでなく「何を意味するか」まで推論する。

✍️

手書き文字を「読む」だけでなく「理解する」

手書きの数字・文字を認識するだけでなく、文脈から意味を補完します。「7」と「1」の判別、略字・崩し字の解釈、記入漏れ箇所の推定。従来OCRが「文字認識器」だとすれば、マルチモーダルLLMは「意味理解器」です。

APPLIES TO

手書き申請書点検・検査票現場作業報告書手書き注文票
📐

非定型レイアウトにテンプレート不要

取引先ごとに異なる請求書フォーマット、バラバラな表の列構成、縦横混在のセル結合。LLMは文書の視覚的構造を人間と同様に「読み解き」、テンプレートなしで構造化データを抽出します。

APPLIES TO

多様な取引先請求書古いExcelを印刷した帳票段組みレポート複合フォーム
🔍

「書かれていないこと」も推論する

金額の内税・外税の判断、記載単位(千円・万円)の推定、日付の表記ゆれ(令和/西暦/略記)の統一。文書に明記されていない文脈的情報を、業務ルール(SKILL.md)との照合で正確に補完します。

APPLIES TO

税率判定単位統一日付表記の正規化取引先コード推定
🗂️

複数ページをまたぐ情報を統合する

1件の取引が複数ページにわたる発注書、添付書類と本文を照合する契約書、前後ページの数値を合算する明細帳票。最新LLMの長大なコンテキスト処理能力で、複数ページを一括して理解します。

APPLIES TO

複数ページ契約書添付資料付き稟議複数明細の発注書継続取引帳票

The Problem

なぜ、帳票処理の
自動化は進まないのか。

AI OCRの精度はすでに実用水準に到達しています。しかし現場の大半の工数は「読み取り後」の照合・判断・例外処理に費やされています。

PAIN 01

手書き・印刷文書の混在で、OCRが使い物にならない

現場点検票・手書き申請書・FAX注文書は、既存OCRの前処理テンプレートが対応できない。帳票種別ごとに個別設定が必要で、メンテナンスコストが際限なく膨らむ。

PAIN 02

「読めた」後の照合・判断が手作業のまま

AI OCRで文字は読めるようになっても、マスタとの照合・金額チェック・承認ルーティングはまだ人手。自動化率が上がらず、コスト削減効果が実感できない。

PAIN 03

CAD図面・設備記号など「特殊文書」は手つかず

製造図面の部品表、住宅平面図の設備記号、建設業の拾い出し表。これらは従来OCRが全く対応できない領域で、デジタル化が10年以上停滞している。

Use Cases

印刷物も手書きも、
あらゆる帳票・文書に対応

特に手書きが多い現場帳票・申請書類は、これまで「自動化は難しい」とされてきた領域です。

🏭

製造業:手書き現場点検票

手書き対応

設備点検記録 / 品質検査票 / 作業日報

EFFECT: 測定値の異常検知を自動化。基準値照合・設備管理システム連携まで完結。

AGENT FLOW

点検票スキャン → 測定値8項目抽出 → 基準値照合・NG自動フラグ → 保全システム更新

手書き対応異常検知設備管理連携
🔩

製造業:CAD図面・部品表(BOM)

設計図面 / BOM / 改訂記録

EFFECT: 部品表の自動登録と手書き修正の検出で図面管理工数を大幅削減。

AGENT FLOW

図面スキャン → 図番・改訂管理 → BOM全数抽出 → 手書き修正検出 → 管理システム連携

CAD図面BOM自動抽出改訂管理
🏠

建設・ハウスメーカー:図面シンボル認識

手書き対応

電気設備図 / 給排水設備図 / 平面図

EFFECT: 設備記号・手書き変更指示の自動認識で、拾い出し工数を従来の1/15に圧縮。

AGENT FLOW

設備図受領 → 電気・給排水記号検出 → 手書き追記認識 → 拾い出し表Excel出力

シンボル認識拾い出し自動化設計変更管理
📋

全業種:社内申請書・稟議書

手書き対応

購買申請 / 経費稟議 / 契約承認

EFFECT: 承認印の有無判定と承認ルーティングを自動化。差し戻し率0件を目標設計。

AGENT FLOW

稟議書スキャン → 申請情報抽出 → 承認印判定 → 未承認者に自動通知 → ワークフロー連携

承認印判定稟議自動化全業種対応
📠

製造・卸売:FAX発注書の自動受注

FAX発注書 / 注文書 / 受注明細

EFFECT: FAX受信から基幹システム登録まで完全自動化。受注ミス・転記ミスをゼロに。

AGENT FLOW

FAX受信 → 発注元・品目・数量抽出 → 合計照合 → 納期分岐検出 → 基幹システム登録

FAX自動化非定型対応受注システム連携
📄

金融・法務:契約書・重要書類

売買契約書 / 覚書 / 誓約書

EFFECT: 契約条件・特記事項の抽出と期日管理を自動化。重要条項の見落としリスクを排除。

AGENT FLOW

契約書受領 → 当事者・金額・期日抽出 → 特記事項フラグ → 契約管理システム登録

契約書対応期日管理リスク抽出

Comparison

従来OCR・LLM単体との違い

比較項目従来OCRツールLLM単体homula Document AI Agent
手書き文字認識△ 精度に限界△ 単体では後工程なし◎ 崩し字・略字も文脈補完
非定型レイアウト× テンプレート必須○ 対応可◎ テンプレート不要・ゼロショット
図面シンボル認識× 非対応○ 対応可◎ 建設・製造図面に特化設計
CAD図面BOM抽出× 非対応△ 構造化は要カスタム◎ 部品表自動構造化・図番管理
FAX・劣化印刷△ 精度低下○ 対応可◎ 前処理+LLMの二段構成
照合・判断(後工程)× なし△ 要プロンプト設計◎ SKILL.mdで業務ルール完全実装
承認フロー連携× なし× なし◎ Slack/Teams/kintone等に直接連携
閉域・セキュア構成○ 可△ SaaS依存◎ 国内リージョン閉域構成対応

Process

最短2週間でPoC開始。
4ステップで本番稼働へ。

01Week 1〜2

キックオフ・文書種別ヒアリング

対象帳票の種別・量・現行フロー・後工程システムを整理。精度目標と例外処理ポリシーを合意します。

02Week 2〜4

PoC開発・精度検証

実際の文書サンプルでパイプライン構築。読み取り精度・後工程連携の動作を測定し、ROI試算を実施。

03Month 2〜3

Agent Skills実装・本番稼働

業務ルール・例外処理・承認フロー定義をSKILL.mdに実装。本番環境でパイロット稼働を開始。

04Month 3〜

運用・横展開

月次レビューで精度改善と対象帳票を拡大。社内他部門・他業務への横展開を段階的に実施。

FAQ

よくある質問

文書種別・品質・手書きの崩れ方によって異なりますが、印刷文書に近い条件では99%超、手書きが混在する現場帳票でも90〜95%以上を実現しているケースが多いです。PoCで実際のお客様文書を使った精度測定を実施してから本番判断いただけます。

n8n・Dify・LangGraphなどのオーケストレーションツールを組み合わせ、SAP・Oracle・kintone・Salesforce・SlackなどのAPIと連携設計します。既存システムへの直接書き込みやWebhook連携も対応可能です。

従来のOCRツールはCAD図面・設備記号の読み取りにほぼ対応できていません。homulaは最新マルチモーダルLLMと業務特化SKILL.mdを組み合わせ、製造図面のBOM抽出・住宅設備図面の記号認識という他社未対応の領域を実現しています。

Azure OpenAI(日本リージョン)によるVNet閉域構成、オンプレミスLLMを使ったローカル構成のいずれにも対応します。入力文書がクラウドLLMのトレーニングデータに使用されない設定も標準で適用します。

AIが判断に迷う低信頼度ケースのみ人間に通知・確認依頼する「ヒューマン・イン・ザ・ループ」設計を標準採用しています。自動処理率の目標値(通常90〜95%)と承認工数の定量目標をPoCで設定します。通常、処理件数の90〜95%以上を自動化し、残り5〜10%の例外のみ人が確認する設計を目指します。

主要帳票3〜5種を対象としたPoCは最短2週間で開始できます。費用はお問い合わせください。PoCではエンドツーエンドのパイプライン構築・精度測定・ROI試算まで実施し、本番導入の判断材料をそろえます。

Get Started

まず、御社の文書を
homulaに見せてください。

手書き点検票・CAD図面・FAX発注書など、「これは難しいのでは」と思っている文書ほど、デモの価値があります。最短2週間でPoC開始できます。