Files
sim/apps/docs/content/docs/ja/blocks/guardrails.mdx
Waleed 93e1c513b2 feat(i18n): update translations (#2120)
* feat(i18n): update translations

* fix build

---------

Co-authored-by: waleedlatif1 <waleedlatif1@users.noreply.github.com>
2025-11-25 21:35:15 -08:00

208 lines
9.5 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: ガードレール
---
import { Callout } from 'fumadocs-ui/components/callout'
import { Image } from '@/components/ui/image'
import { Video } from '@/components/ui/video'
ガードレールブロックは、複数の検証タイプに対してコンテンツをチェックすることで、AIワークフローを検証し保護します。データ品質の確保、ハルシネーション幻覚の防止、個人情報の検出、フォーマット要件の強制などをワークフローに組み込む前に行います。
<div className="flex justify-center">
<Image
src="/static/blocks/guardrails.png"
alt="ガードレールブロック"
width={500}
height={400}
className="my-6"
/>
</div>
## 検証タイプ
### JSON検証
コンテンツが適切にフォーマットされたJSONであることを検証します。構造化されたLLM出力を安全に解析できることを確認するのに最適です。
**ユースケース:**
- 解析前にエージェントブロックからのJSON応答を検証
- APIペイロードが適切にフォーマットされていることを確認
- 構造化データの整合性をチェック
**出力:**
- `passed`: 有効なJSONの場合は `true`、それ以外の場合は `false`
- `error`: 検証が失敗した場合のエラーメッセージ「無効なJSON予期しないトークン...」)
### 正規表現検証
コンテンツが指定された正規表現パターンに一致するかどうかをチェックします。
**ユースケース:**
- メールアドレスの検証
- 電話番号形式のチェック
- URLやカスタム識別子の確認
- 特定のテキストパターンの強制
**設定:**
- **正規表現パターン**: 照合する正規表現(例:メールの場合は `^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$`
**出力:**
- `passed`: コンテンツがパターンに一致する場合は `true`、それ以外の場合は `false`
- `error`: 検証が失敗した場合のエラーメッセージ
### 幻覚検出
検索拡張生成RAGとLLMスコアリングを使用して、AI生成コンテンツがナレッジベースと矛盾している場合や、ナレッジベースに根拠がない場合を検出します。
**仕組み:**
1. 関連するコンテキストについてナレッジベースに問い合わせる
2. AI出力と取得したコンテキストの両方をLLMに送信
3. LLMが信頼度スコア0〜10のスケールを割り当てる
- **0** = 完全な幻覚(まったく根拠なし)
- **10** = 完全に根拠あり(ナレッジベースで完全にサポートされている)
4. スコアが閾値以上デフォルト3であれば検証に合格
**設定:**
- **ナレッジベース**: 既存のナレッジベースから選択
- **モデル**: スコアリング用のLLMを選択強力な推論能力が必要 - GPT-4o、Claude 3.7 Sonnetを推奨
- **APIキー**: 選択したLLMプロバイダーの認証ホスト型/OllamaまたはVLLM互換モデルの場合は自動的に非表示
- **信頼度しきい値**: 合格するための最小スコア0-10、デフォルト: 3
- **Top K**(高度な設定): 取得するナレッジベースのチャンク数(デフォルト: 10
**出力:**
- `passed`: 信頼度スコア ≥ しきい値の場合は `true`
- `score`: 信頼度スコア0-10
- `reasoning`: スコアに対するLLMの説明
- `error`: 検証が失敗した場合のエラーメッセージ
**ユースケース:**
- ドキュメントに対するエージェントの回答を検証
- カスタマーサポートの回答が事実に基づいていることを確認
- 生成されたコンテンツがソース資料と一致することを確認
- RAGアプリケーションの品質管理
### PII検出
Microsoft Presidioを使用して個人を特定できる情報を検出します。複数の国と言語にわたる40以上のエンティティタイプをサポートしています。
<div className="flex justify-center">
<Image
src="/static/blocks/guardrails-2.png"
alt="PII検出の設定"
width={700}
height={450}
className="my-6"
/>
</div>
**仕組み:**
1. 検証するコンテンツを渡す(例:`<agent1.content>`
2. モーダルセレクターを使用して検出するPIIタイプを選択
3. 検出モード(検出またはマスク)を選択
4. コンテンツが一致するPIIエンティティをスキャン
5. 検出結果と、オプションでマスクされたテキストを返す
<div className="mx-auto w-3/5 overflow-hidden rounded-lg">
<Video src="guardrails.mp4" width={500} height={350} />
</div>
**設定:**
- **検出するPIIタイプ**: モーダルセレクターからグループ化されたカテゴリを選択
- **一般**: 人名、メール、電話番号、クレジットカード、IPアドレスなど
- **アメリカ**: 社会保障番号、運転免許証、パスポートなど
- **イギリス**: NHS番号、国民保険番号
- **スペイン**: NIF、NIE、CIF
- **イタリア**: 納税者番号、運転免許証、VAT番号
- **ポーランド**: PESEL、NIP、REGON
- **シンガポール**: NRIC/FIN、UEN
- **オーストラリア**: ABN、ACN、TFN、Medicare
- **インド**: Aadhaar、PAN、パスポート、有権者番号
- **モード**:
- **検出**: PIIを識別するのみデフォルト
- **マスク**: 検出されたPIIをマスク値に置き換え
- **言語**: 検出言語(デフォルト:英語)
**出力:**
- `passed`: 選択したPIIタイプが検出された場合は `false`
- `detectedEntities`: タイプ、位置、信頼度を含む検出されたPIIの配列
- `maskedText`: PIIがマスクされたコンテンツモード = "Mask"の場合のみ)
- `error`: 検証が失敗した場合のエラーメッセージ
**ユースケース:**
- 機密性の高い個人情報を含むコンテンツをブロック
- データのログ記録や保存前にPIIをマスク
- GDPR、HIPAA、その他のプライバシー規制への準拠
- 処理前のユーザー入力のサニタイズ
## 設定
### 検証するコンテンツ
検証する入力コンテンツ。通常、以下から取得されます:
- エージェントブロックの出力: `<agent.content>`
- 関数ブロックの結果: `<function.output>`
- APIレスポンス: `<api.output>`
- その他のブロック出力
### 検証タイプ
4つの検証タイプから選択
- **有効なJSON**: コンテンツが適切にフォーマットされたJSONかどうかを確認
- **正規表現マッチ**: コンテンツが正規表現パターンに一致するか検証
- **幻覚チェック**: LLMスコアリングによる知識ベースとの検証
- **PII検出**: 個人を特定できる情報を検出し、オプションでマスク
## 出力
すべての検証タイプは以下を返します:
- **`<guardrails.passed>`**: 検証が成功したかどうかを示すブール値
- **`<guardrails.validationType>`**: 実行された検証のタイプ
- **`<guardrails.input>`**: 検証された元の入力
- **`<guardrails.error>`**: 検証が失敗した場合のエラーメッセージ(オプション)
タイプ別の追加出力:
**幻覚チェック:**
- **`<guardrails.score>`**: 信頼度スコア0-10
- **`<guardrails.reasoning>`**: LLMの説明
**PII検出:**
- **`<guardrails.detectedEntities>`**: 検出されたPIIエンティティの配列
- **`<guardrails.maskedText>`**: PIIがマスクされたコンテンツモード = "マスク"の場合)
## ユースケース例
**解析前のJSONの検証** - エージェント出力が有効なJSONであることを確認
```
Agent (Generate) → Guardrails (Validate) → Condition (Check passed) → Function (Parse)
```
**幻覚の防止** - カスタマーサポートの回答を知識ベースと照合して検証
```
Agent (Response) → Guardrails (Check KB) → Condition (Score ≥ 3) → Send or Flag
```
**ユーザー入力のPIIをブロック** - ユーザーが提出したコンテンツをサニタイズ
```
Input → Guardrails (Detect PII) → Condition (No PII) → Process or Reject
```
## ベストプラクティス
- **条件ブロックと連携**: `<guardrails.passed>`を使用して検証結果に基づいてワークフローロジックを分岐
- **解析前のJSON検証**: LLM出力を解析する前に常にJSON構造を検証
- **適切なPIIタイプの選択**: パフォーマンス向上のため、ユースケースに関連するPIIエンティティタイプのみを選択
- **合理的な信頼度しきい値の設定**: 幻覚検出では、精度要件に基づいてしきい値を調整(高い = より厳格)
- **幻覚検出には強力なモデルを使用**: GPT-4oまたはClaude 3.7 Sonnetはより正確な信頼度スコアリングを提供
- **ログ記録用のPIIマスク**: PIIを含む可能性のあるコンテンツをログに記録または保存する場合は「マスク」モードを使用
- **正規表現パターンのテスト**: 本番環境にデプロイする前に正規表現パターンを徹底的に検証
- **検証失敗の監視**: `<guardrails.error>`メッセージを追跡して一般的な検証問題を特定
<Callout type="info">
ガードレールの検証はワークフローで同期的に行われます。幻覚検出については、レイテンシーが重要な場合は、より高速なモデルGPT-4o-miniなどを選択してください。
</Callout>