事前作成済みのスキーマを使用したドキュメントの分析

事前作成済みのスキーマを使用せずに任意の種別のドキュメントを分析して出力構造を完全にカスタマイズするには、カスタムユーザー定義スキーマを使用したドキュメントの分析を参照してください。

ドキュメントアクション​は、複数の AI エンジンを使用するマルチステッププロセスで、ドキュメントをスキャンし、項目を除外して、構造化された応答を JSON オブジェクトとして返します。各ドキュメントアクションは、入力として想定されるドキュメントの種別、抽出する項目、応答から除外する項目を定義します。

項目を非表示にしたり、項目を必須とマークしたり、抽出する各項目で受け入れられる最小信頼度スコアを設定したり、自然言語を使用して質問することでデータ抽出プロセスが強化および改良されるようにプロンプトを設定したりできます。

定義済みの種別をテンプレートとして使用してドキュメントアクションを作成し、必須項目、JSON 応答から除外する必要がある項目、各項目に期待される最小信頼度スコアを指定します。

新しいドキュメントアクションを作成したら、レビュー担当者を追加して Anypoint Exchange にパブリッシュすると、RPA でドキュメントアクションを実行できるようになり、任意の外部システムからコールできる API も作成されます。

ドキュメントアクションを作成するときに、設定されたスキーマがアップロードされた各ドキュメントで動作することを確認してください。すべてのサンプルドキュメントで動作するようにスキーマをカスタマイズできない場合は、複数のドキュメントアクションを作成することを検討してください。たとえば、ベンダーごとに個別のドキュメントアクションを必要とするほど、複数のベンダーからの購入注文が異なっている場合があります。

事前作成済みのスキーマを使用してドキュメントアクションを作成するには、次のタスクを完了する必要があります。

ドキュメントアクションの作成を始める前に

次のいずれかの Anypoint 権限があることを確認します。

Manage Actions (アクションの管理)

ユーザーに IDP への完全なアクセス権を付与し、デフォルトですべてのドキュメントアクションのレビュー担当者権限を割り当てます。

Build Actions (アクションの作成)

ユーザーがドキュメントアクションを作成、編集、パブリッシュ、実行し、レビュー担当者をアクションに割り当てることができるようにします。

サンプルファイルをアップロードして結果をプレビューする

新しいドキュメントアクションの作成を開始するには、サンプルファイルをアップロードして抽出プロセスをテストします。

  1. サイドバーで、​[Document Actions (ドキュメントアクション)]​ をクリックします。

  2. [Create New (新規作成)]​ をクリックします。

  3. テンプレートとして使用するドキュメントの種別を選択し、ドキュメントアクションの名前を指定して、​[Create (作成)]​ をクリックします。

  4. [Select files (ファイルを選択)]​ をクリックし、分析するサンプルファイルをアップロードします。

    ファイルは 10 個までアップロードでき、ファイルあたり 8 MB のサイズ制限があります。

  5. [Run (実行)]​ をクリックしてファイルを分析し、結果のプレビューを取得します。

ドキュメントアクションエディターには、分析したドキュメントのプレビューが表示され、見やすいようにズームインやズームアウトができます。​[Previous (前へ)]​ (​<​) ボタンと ​[Next (次へ)]​ (​>​) ボタンを使用して、ドキュメントのページを移動します。ページを切り替えると、​[Outputs (出力)]​ セクションに表示される抽出値が更新されます。

抽出された値の信頼度スコアが設定されたしきい値を下回っている場合、項目が黄色で強調表示されます。

サンプルファイルをアップロードしたら、スキーマを設定します。

抽出用のスキーマを設定する

汎用ドキュメントアクションを作成する場合は、スキーマを設定しないため、このステップをスキップします。代わりに、ドキュメントからデータを抽出するプロンプトを使用します。

応答で非表示にする項目、必須項目、各項目で受け入れられる最小信頼度スコアを選択して、スキーマを設定します。

  1. [Outputs (出力)]​ セクションで ​[Fields (項目)]​ をクリックし、抽出された項目名のいずれかを選択して、次の設定を定義します。

    • Visibility (表示)​: この項目を出力 JSON 結果に表示するかどうかを定義します。この項目を非表示にするには、​[Visibility (表示)]​ (​2%​) をクリックします。

    • Threshold (しきい値)​: この項目で受け入れられる最低限必要な信頼度スコア。返された ​[Confidence (信頼度)]​ の値がしきい値を下回っている場合、ドキュメントは人間によるレビューのためにキューに追加されます。

    • Required (必須)​: 項目が見つからないか抽出できない場合にドキュメントをレビューに送信するには、このオプションを選択します。

    [Focus (フォーカス)]​ (​2%​) をクリックすると、対応する項目がプレビューの中央に表示されます。

  2. ドキュメントにテーブルが含まれている場合は、​[Tables (テーブル)]​ をクリックして、テーブル列の抽出設定を定義します。

スキーマを設定したら、プロンプトをドキュメントアクションに追加します。

プロンプトを追加して結果を絞り込む

プロンプトを追加して、自然言語でドキュメントに関する質問をして抽出結果を絞り込みます。

  1. [Outputs (出力)]​ パネルで ​[Prompts (プロンプト)]​ をクリックします。

  2. [Add New (新規追加)]​ をクリックします。

  3. 必要な詳細を設定します。

    • Name (名前)​: クエリの一意の名前。

    • Instruction (指示)​: 自然言語を使用した英語の一意の質問または要求。

      プロンプトは特殊文字をサポートしていません。プロンプトを記述するときは英数字を使用してください。この制限は、任意の種類の文字または記号を含めることができるドキュメントには適用されません。
    • Required (必須)​: 質問に回答できない場合にドキュメントをレビューに送信するには、このオプションを選択します。

    • Confidence Threshold (信頼度のしきい値)​: ドキュメントがレビューのキューに追加されないようにするための最小許容値。

  4. [Add (追加)]​ をクリックします。

  5. [Run (実行)]​ をクリックしてドキュメントを再度分析し、プロンプトの結果を確認します。

  6. [Save (保存)]​ をクリックします。

Einstein を使用したデータ抽出の強化

デフォルトでは、IDP はその自然言語処理モデル (IDP NLP) を使用して、設定されたプロンプトに基づいてデータを抽出します。ドキュメントアクションを作成するときに、Einstein を選択してドキュメントの分析とデータの抽出を行うことができます。

Einstein を使用して、ドキュメントに関する複雑な質問 (税金を差し引いた後の請求書の合計は? など) の回答を得たり、非標準ドキュメントのデータ (筆跡が含まれる運転免許証やカルテなど) を抽出したりします。

Einstein でプロンプトに回答してデータ抽出を改善するには、Einstein を使用したデータ抽出の強化を参照してください。

ドキュメントアクション設定を定義する

ドキュメントアクションを作成したら、​[Settings (設定)]​ をクリックして設定します。使用可能な設定は、ドキュメントアクションを作成したタイミングによって異なります。

設定 説明 使用可能になるタイミング 考慮事項

Model (モデル)

このドキュメントアクションを実行するときに使用する予測大規模言語モデル (LLM) を選択します。

2025 年 2 月 5 日

ドキュメント処理のニーズに最も適したモデルを選択してください。各モデルについての詳細は、サポートされるモデルを参照してください。

PII Masking (PII マスキング)

ドキュメントを予測モデルに送信する前にそれらの個人情報をマスクします。

2025 年 2 月 5 日

  • Salesforce 組織の設定は、この設定よりも優先されます。

  • 文字制限が要求あたり 120,000 文字に削減されます。

    詳細は、​「プロンプトの制限」​を参照してください。

  • [Image Recognition (画像認識)] と同時に使用することはできません。

  • 詳細は、 「Einstein Trust Layer」​を参照してください。

Image Recognition (画像認識)

ドキュメント内の画像をモデルで読み取って解釈できるようにします。

2025 年 5 月 8 日

  • 選択されたモデルによっては、Einstein クレジット消費が増加する可能性があります。

    クレジットの使用と消費については、Salesforce アカウントエグゼクティブにお問い合わせください。

  • [PII Masking (PII マスキング)] と同時に使用することはできません。

  • チェックボックス処理の精度は、フォームの複雑さによってモデルごとに異なります。

    チェックボックスを処理するときの各モデルのパフォーマンスについての詳細は、サポートされるモデルを参照してください。

すべての新機能にアクセスするには、新しいドキュメントアクションを作成してください。