PASS、MASK、またはBLOCK — を返します。
System GuardianとProject Guardian
System Guardian
プラットフォームに登録されたマスター定義です(例:
VLM-OCRプリセット)。Guardianがサポートする機能 — Input Type、Policy Type、process type、運用上限、モデル構成 — を宣言します。Project Guardian
Project内に作成するコピーです。運用設定(どのGuard Policyが割り当てられているか、モデル構成のオーバーライド、有効なカテゴリ、独自のライフサイクル)を保持します。API キーやDesktop Agentが呼び出すのはこちらです。
仕様は凍結され、設定はお客様のもの
「なぜ変更が反映されないのか?」という混乱の大半は、2つのルールで説明できます。- System Guardianの仕様は、登録後は不変です。 いったん登録されると、変更できるのは名前、説明、Endpoint URL、可視性(スコープ+Enabled)のみです。機能仕様 — サポートされるInput Type、Policy Type、process type、上限、モデル構成キー — は凍結されます。
- Project Guardianは作成時にその仕様をコピーし、独立して保持します。 後からSystem Guardianを編集しても、その変更はさかのぼって伝播しません。参照され続けるのはライブのEndpoint URLのみです。互換性のあるPolicy Typeの集合(検査できる対象)はSystem Guardianによって固定されたままですが、その範囲内の運用値(割り当てられたGuard Policy、テキスト/ファイルの上限、有効なカテゴリ、モデル構成)はお客様が自由にチューニングできます。
Input Type
Guardianは、検査できるコンテンツの種類を宣言します。Guardianごとにそのサブセットを有効化します。| Input Type | 例 |
|---|---|
| Text | プロンプト、メッセージ |
| Image | PNG、JPG、WebP、GIF、… |
| Audio | WAV、MP3 |
| Video | MP4 |
| Document | PDF、DOCX、XLSX、PPTX、TXT、CSV、… |
| Archive | ZIP |
process type: inputとoutput
Guardianはprocess typeごとにコンテンツを評価します。process typeとは、Guardianが定義する自由形式のラベルです(一般的にはinputとoutput)。
input— モデルへ送られるコンテンツ(ユーザーのプロンプト)。output— モデルから返ってくるコンテンツ(応答)。
policiesも送信されません(追加入力のみで動作します)。
Guardianのコントラクト
いずれのGuardian実装も、プラットフォームが駆動できるよう、小さなベースラインのコントラクトを満たす必要があります。- ステートレス — すべてのリクエストは独立して処理されます。ユーザー管理、認証、トレースログはBastionの役割であり、Guardianの役割ではありません。
- 正規化されたフォーマット — Guardian Input Formatを受け取り、Guardian Output Formatで応答します。
- 3つのベースラインエンドポイント —
/guardian(解析)、/info(自己記述)、/health(生存確認のみ)。これに加えて、任意でモデルごとの診断があります。
/infoはシード(種)であり、信頼できる情報源(source of truth)ではありません。登録時にそのレスポンスがフォームを事前入力し、System Adminが保存した結果がシステムの信頼できる情報源となります。
Guardian Fail-Closed
Guardianは、完全に解析できたリクエストに対してのみ成功レスポンスを返します。解析を完了できない場合 — モデルがダウンしている、ファイルを抽出できない、あるいは複数のモデル呼び出しのうち1つでも失敗した場合(部分的失敗)— は、HTTPエラーを返し、検出ゼロの「成功」を返すことは決してありません。これにより、「検出なし」は常に解析した上で何も見つからなかったことを意味し、障害が知らないうちにPASSになることは決してありません。モデル構成
各Guardianは実効的なモデル構成を持ちます。これは、エンジンのデフォルトに、プロジェクトレベルのオーバーライド(例:confidence_threshold)をマージしたものです。管理者はGuardianの詳細ページでこれらを確認し、オーバーライドできます。
Guardianは、ポリシーが割り当てられており、かつそれらのポリシーバージョンが適用されている場合にのみ動作します。ポリシー更新のバージョン管理と適用を参照してください。