カスタムユーザー定義スキーマを使用したドキュメントの分析

任意の種別のドキュメントを分析し、汎用ドキュメントアクションを作成して ​[Customize Schema (スキーマをカスタマイズ)]​ を有効にすることで出力構造を完全にカスタマイズします。Einstein でドキュメントの分析とデータの抽出を行うことができるように、出力項目およびテーブルを定義してプロンプト手順を設定します。

[Customize Schema (スキーマをカスタマイズ)]​ を有効にすると、IDP が 1 つのプロンプトでドキュメント全体を照会するため、要求と Einstein クレジット消費も削減されます。​[Customize Schema (スキーマをカスタマイズ)]​ が有効になっていない汎用ドキュメントアクションでは、Einstein に対してプロンプトごとに 1 つの要求が実行されます。

既存のドキュメントアクションでは ​[Customize Schema (スキーマをカスタマイズ)]​ を有効にできないため、新しい汎用ドキュメントアクションを作成する必要があります。

Einstein では、次の予測モデルがサポートされています。

  • OpenAI の ​GPT-4o (gpt-4o-2024-08-06)​ LLM

  • OpenAI の ​GPT-4o Mini (gpt-4o-mini-2024-07-18)​ LLM

  • Google の ​GEMINI-2.0 Flash 001​ LLM

Einstein は、Salesforce Einstein プラットフォームの一部である Salesforce Einstein Trust Layer を介してこれらのモデルにアクセスします。

ドキュメントアクションエディターの ​[Settings (設定)]​ をクリックして、ドキュメント分析時に使用するモデルを選択します。

2 月 5 日より前に作成されたドキュメントアクションでは、OpenAI の ​GPT-4o (gpt-4o-2024-05-13)​ のみがサポートされます。モデル選択と新しいモデルを有効にするには、新しいドキュメントアクションを作成してください。使用可能な機能と設定についての詳細は、​「ドキュメントアクション設定を定義する」​を参照してください。

ドキュメントアクション​は、複数の AI エンジンを使用するマルチステッププロセスで、ドキュメントをスキャンし、項目を除外して、構造化された応答を JSON オブジェクトとして返します。各ドキュメントアクションは、入力として想定されるドキュメントの種別、抽出する項目、応答から除外する項目を定義します。

ドキュメントアクションを作成したら、レビュー担当者を追加してドキュメントアクションを Anypoint Exchange にパブリッシュします。ドキュメントアクションをパブリッシュすると、RPA がドキュメントアクションを実行できるようになります。また、任意の外部システムからコールしてドキュメントを分析できる API も作成されます。

事前作成済みのスキーマを使用する手順については、事前作成済みのスキーマを使用したドキュメントの分析を参照してください。

始める前に

  1. 次のいずれかの Anypoint 権限があることを確認します。

    Manage Actions (アクションの管理)

    ユーザーに IDP への完全なアクセス権を付与し、デフォルトですべてのドキュメントアクションのレビュー担当者権限を割り当てます。

    Build Actions (アクションの作成)

    ユーザーがドキュメントアクションを作成、編集、パブリッシュ、実行し、レビュー担当者をアクションに割り当てることができるようにします。

  2. MuleSoft Anypoint Platform が MuleSoft アセットを Salesforce にパブリッシュできるようにする​。

  3. Anypoint Platform で Einstein を有効にする​。

汎用ドキュメントアクションを作成して [Customize Schema (スキーマをカスタマイズ)] を有効にする

ドキュメントを分析し、出力構造を完全にカスタマイズするには、[Generic (汎用)] 種別のドキュメントアクションを作成し、​[Customize Schema (スキーマをカスタマイズ)]​ を有効にします。

  1. サイドバーで、​[Document Actions (ドキュメントアクション)]​ をクリックします。

  2. [Create New (新規作成)]​ をクリックします。

  3. [Generic (汎用)]​ 種別を選択します。

  4. [Customize Schema (スキーマをカスタマイズ)]​ を有効にします。

    [Customize Schema (スキーマをカスタマイズ)]​ を有効にすると、項目およびテーブルを定義して、分析されたドキュメントの構造化出力を作成できます。この機能により、ドキュメントアクションビルダーの項目およびテーブルの拡張プレビューも有効になります。

    [Customize Schema (スキーマをカスタマイズ)]​ が無効になっていても、Einstein プロンプトを設定してドキュメントを分析できます。手順については、Einstein を使用したデータ抽出の強化を参照してください。

    [Customize Schema (スキーマをカスタマイズ)]​ を有効にしないでドキュメントアクションを作成すると、Einstein クレジット消費が最適化されず、プロンプトが発生するたびに、LLM に対する 1 つの API コールとみなされます。
  5. 名前を入力して、​[Create (作成)]​ をクリックします。

次に、抽出する項目およびテーブルを追加します。

抽出する項目を追加する

抽出する項目を設定して出力ドキュメントの構造を定義する手順は、次のとおりです。

  1. ドキュメントアクションビルダーで、​[Select Files (ファイルを選択)]​ をクリックし、抽出のサンプルまたはモデルとして使用するファイルを選択します。

  2. [Outputs (出力)]​ パネルで ​[Fields (項目)]​ タブを選択します。

  3. [Start from Scratch (最初から作成)]​ をクリックして、最初の項目を追加します。

  4. 項目とプロンプトの名前を入力します。

    プロンプトを設定しない場合、Einstein によってドキュメントがスキャンされ、項目に最適なデータが自動的に抽出されます。ただし、出力をテストし、抽出された項目が想定される結果と一致していることを確認してください。プロンプトを設定する場合、その項目の入力方法に関する具体的な手順を Einstein に提供します。

  5. [Add New (新規追加)]​ をクリックして、引き続き項目を追加します。

  6. [Run (実行)]​ をクリックし、抽出の結果を確認します。

  7. [Save (保存)]​ をクリックします。

抽出するテーブルを追加する

テーブルからのデータ抽出を設定する手順は、次のとおりです。

  1. ドキュメントアクションビルダーで、​[Select Files (ファイルを選択)]​ をクリックし、抽出のサンプルまたはモデルとして使用するファイルを選択します。

    サンプルファイルがすでに読み込まれている場合は、このステップをスキップします。

  2. [Outputs (出力)]​ パネルで ​[Tables (テーブル)]​ タブを選択します。

  3. [Start from Scratch (最初から作成)]​ をクリックして、最初のテーブルを追加します。

  4. 必要に応じてテーブルとプロンプトの名前を入力し、抽出するデータを設定します。

  5. [Add New Column (新しい列を追加)]​ をクリックして、名前を入力し、列のプロンプトを入力します。

    • テーブルが完成するまで、引き続き列を追加します。

  6. 設定するテーブルがまだある場合、​[Add New (新規追加)]​ をクリックして、テーブル列を追加する手順を繰り返します。

  7. [Run (実行)]​ をクリックし、抽出の結果を確認します。

  8. [Save (保存)]​ をクリックします。

ドキュメントの出力スキーマの設定が完了したら、レビュー担当者を追加してドキュメントアクションをパブリッシュします。

ドキュメントアクション設定を定義する

ドキュメントアクションを作成したら、​[Settings (設定)]​ をクリックして設定します。使用可能な設定は、ドキュメントアクションを作成したタイミングによって異なります。

設定 説明 使用可能になるタイミング 考慮事項

Model (モデル)

このドキュメントアクションを実行するときに使用する予測大規模言語モデル (LLM) を選択します。

2025 年 2 月 5 日

ドキュメント処理のニーズに最も適したモデルを選択してください。各モデルについての詳細は、サポートされるモデルを参照してください。

PII Masking (PII マスキング)

ドキュメントを予測モデルに送信する前にそれらの個人情報をマスクします。

2025 年 2 月 5 日

  • Salesforce 組織の設定は、この設定よりも優先されます。

  • 文字制限が要求あたり 120,000 文字に削減されます。

    詳細は、​「プロンプトの制限」​を参照してください。

  • [Image Recognition (画像認識)] と同時に使用することはできません。

  • 詳細は、 「Einstein Trust Layer」​を参照してください。

Image Recognition (画像認識)

ドキュメント内の画像をモデルで読み取って解釈できるようにします。

2025 年 5 月 8 日

  • 選択されたモデルによっては、Einstein クレジット消費が増加する可能性があります。

    クレジットの使用と消費については、Salesforce アカウントエグゼクティブにお問い合わせください。

  • [PII Masking (PII マスキング)] と同時に使用することはできません。

  • チェックボックス処理の精度は、フォームの複雑さによってモデルごとに異なります。

    チェックボックスを処理するときの各モデルのパフォーマンスについての詳細は、サポートされるモデルを参照してください。

すべての新機能にアクセスするには、新しいドキュメントアクションを作成してください。