# 伝票抽出v1_VLM単発 — 運用ガイド

## 基本情報

| 項目 | 内容 |
|------|------|
| 業界 | 会計 |
| ユースケース | 伝票抽出v1_VLM単発 |
| 元WF名 | `Voucher Extractor (VLM Single)` |
| 補足 | デモ向け・最小構成 |
| 元プロジェクト | `~/Claude/110_会計・発注・受注伝票/dify/workflows/v1_vlm_single.yml` |
| マイグレーション | 2026-05-27 |

## 概要

見積書/注文書から発注/受注伝票用の構造化JSONを抽出する(VLM単体版)

## 用途

見積書/注文書 → 発注伝票/受注伝票の自動転記。VLM (Vision Language Model) で画像/PDFを直接読み取り、構造化JSON出力。会計CSV(弥生/PCA/OBC形式)への変換が後続スクリプトで可能。

## サンプル入力

`~/Claude/110_会計・発注・受注伝票/samples/` 配下のサンプルをアップロード:
- `quotation/` — 見積書サンプル PDF
- `purchase_order/` — 注文書サンプル PDF
- `handwritten/` — 手書き伝票
- `scanned_medium/` — 通常品質スキャン
- `scanned_heavy/` — 低品質スキャン (汚れ・回転含む)

## PoCベンチマーク結果

`~/Claude/110_会計・発注・受注伝票/results/` の JSON を参照:
- `poc_claude_haiku.json` / `poc_claude_sonnet.json` — Anthropic比較
- `poc_gpt4o_mini.json` / `poc_gpt5_mini.json` — OpenAI比較
- `poc_gpt5_mini_handwritten.json` — 手書き精度
- `poc_gpt5_mini_scanned_medium.json` / `_heavy.json` — スキャン品質別精度
- `dify_*.json` — Dify経由バリエーション

## 関連UC (v1〜v5 のバリエーション)

| バージョン | 特徴 | 適用場面 |
|---|---|---|
| v1 (VLM単発) | シンプル、VLM 1ノードのみ | デモ・低コスト |
| v2 (OCR+VLM) | PaddleOCR/Tesseract前処理 | 中精度・コスト抑制 |
| v3 (RapidOCR/PDF対応) | ONNX高速OCR、PDF直対応 | 業務寄り |
| v4 (Document AI + VLM) | Google Document AI併用 | 高精度・GCP依存 |
| v5 (DocAI雛形 + VLM補完 HITL) | 雛形生成→VLM補完→人手分岐 | 実運用向け |

## デプロイ手順

1. DDF Web UI (`/dashboard`) で「業界: 会計」フィルタ → 本UC選択
2. 「デモ生成」 → Dify にインポート
3. Dify Web UI で `samples/` のPDFをアップロードして実行

## 既知の制約

- VLM 入力は **file-upload (PDF/JPG/PNG)** 必須。Dify Web UI から直接アップロードして実行
- 一部UC (v4/v5) は **Google Document AI API キー**が必要 (envで設定)
- v3_pdf_supported は **外部PDF→画像化API**を呼ぶ (環境変数で設定)
