クォータと制限

次の表に、IDP サービスのクォータと制限を示します。

Limit (制限) 説明

受け入れられるファイル形式

PDF、PNG、JPG、TIFF (150 DPI 以上を推奨)
ドキュメントアクションビルダーでは、TIFF ファイルのプレビューはサポートされていません。ただし、それらのファイルからデータを抽出して結果を表示することはできます。

ファイルサイズの制限

UI 経由のアップロード API 経由のアップロード
  • アップロードあたり 10 ファイル

  • ファイルあたり 50 ページ

  • ファイルあたり 8 MB

  • API 要求あたり 1 ファイル

  • ファイルあたり 50 ページ

  • ファイルあたり 10 MB

プロンプトの制限

  • ドキュメントアクションごとに 30

    [Customize Schema (スキーマをカスタマイズ)]​ が無効になっている場合。

  • 英語のプロンプト
    その他の言語のプロンプトは完全にはサポートされていません。

  • 一意のプロンプト

    重複するプロンプト名または指示は許可されていません。

    汎用ドキュメントアクションでは、​[Customize Schema (スキーマをカスタマイズ)]​ が有効になっている場合、重複する手順がサポートされます。

  • Einstein プロンプトでは要求あたり 128,000 ​トークン

    • PII マスキングが有効になっている場合、Einstein プロンプトでは要求あたり 30,000 トークン

    要求のトークンの合計数には以下が含まれます。

    • 分析するソースドキュメントに含まれるテキスト

    • 画像認識機能で分析する画像

    • すべての項目、テーブル、列名 (それらの対応する手順および ​[Customize Schema (スキーマをカスタマイズ)]​ で作成されたスキーマを含む) の合計

    • IDP が要求を処理するために使用するトークン (約 1,000)

プロンプト応答の制限

  • IDP NLP プロンプトでは 128 文字

  • GPT-4o (gpt-4o-2024-05-13)​ を使用する Einstein プロンプトでは、出力として約 3,000 語

  • GPT-4o (gpt-4o-2024-08-06)​ または ​GPT-4o Mini (gpt-4o-mini-2024-07-18)​ を使用する Einstein プロンプトでは、出力として約 4,000 語

  • Einstein GEMINI-2.0 Flash 001​ を使用する Einstein プロンプトでは、出力として約 6,000 語

要求制限

  • 要求数が Salesforce 組織の Einstein レート制限を超えると、IDP の実行に失敗します。

    • Einstein を使用していて、​[Customize Schema (スキーマをカスタマイズ)]​ が有効になっている場合: 300 要求/分

    • Einstein を使用していて、​[Customize Schema (スキーマをカスタマイズ)]​ が無効になっている場合: (300 / ドキュメントアクションの Einstein プロンプトの数) 要求/分

  • 100 同時ジョブ/分

ドキュメント言語

言語サポートは、ドキュメントアクションの選択された大規模言語モデル (LLM) によって異なります。 プロバイダーごとのサポートされている言語のリストについては、以下を参照してください。

ポーリング制限

10 秒間隔で結果を取得
アプリケーションは、10 秒ごとよりも頻繁に結果をポーリングしないようにする必要があります。

チェックボックス

チェックボックス処理の精度は、フォームの複雑さによってモデルごとに異なります。多くの代表的なドキュメントで徹底的にテストして、ユースケースで許容できるパフォーマンスを確認します。チェックボックスを処理するときの各モデルのパフォーマンスについての詳細は、サポートされるモデルを参照してください。

トークン使用量と見積

トークンは、大規模言語モデル (LLM) で処理するテキストの単位です。トークンは、入力データを管理可能な単位 (分析および生成できる単位) に分割するために必要不可欠です。トークンの長さを理解するのに役立つ見積換算を次に示します。

  • 1 トークン ~ = 4 文字

  • 1 トークン ~ = ¾ 語

  • 1 ~ 2 文 ~ = 30 トークン

  • 1,500 語 ~ = 2048 トークン

画像を分析する場合、モデルごとに異なるトークナイゼーション戦略が使用されます。これはトークンの計算方法に影響します。追加の指針については、各プロバイダーのドキュメントを参照してください。

ドキュメント保持ポリシー

IDP は、ドキュメントファイルを取得してデータを抽出し、必要に応じてドキュメント抽出を処理します。IDP は、次の機能を使用してデータ保持を強化します。

  • ドキュメントアクションエディター

    IDP は、テストプロセス中にエディターで変更したファイルを一時的に保存し、エディターを閉じた直後にこれらのファイルを削除します。また、IDP はセッションの終了時や新規ファイルのアップロード時に抽出されたデータとファイルを削除します。

  • ドキュメントアクション実行エンドポイント

    実行エンドポイント API を使用すると、IDP はファイルを S3 バケットに保存し、実行中に抽出されたデータを安全に保存します。

すべての実行に成功すると、IDP はこのデータを 24 時間保持します。人間によるレビューを必要とする実行の場合、ユーザータスクの完了後 7 日間このデータを保持します。IDP は、未完了タスクを 30 日間保持します。現在、これらの保持期間を設定することはできません。

データレジデンシーポリシー

IDP は、AWS サービス (S3 や RDS など) を使用して、ファイルと抽出されたデータを保存します。現在、IDP では US (バージニア) と EU (フランクフルト、ドイツ) の 2 つリージョンがサポートされています。IDP は、GDPR 要件を満たすために Anypoint コントロールプレーンリージョンに最も近いデータを保存します。たとえば、Anypoint コントロールプレーンが EU リージョンで実行されている場合、IDP はフランクフルトデータセンターのデータを保存します。