IDP の概要

MuleSoft インテリジェントドキュメント処理 (IDP) を使用すると、請求書、購入注文、その他の非構造化ドキュメントや半構造化ドキュメントを読み取り、AI 機能を使用して抽出されたコンテンツを分析および絞り込んで構造化された応答を作成できます。

シンプルな IDP インターフェースでは、外部サービスにサブスクライブしなくても、RPA、Mule アプリケーション、その他のシステムとのインテグレーションで使用するドキュメントアクションを作成し、API としてパブリッシュできます。

ドキュメントアクション​は、複数の AI エンジンを使用するマルチステッププロセスで、ドキュメントをスキャンし、項目を除外して、構造化された応答を JSON オブジェクトとして返します。各ドキュメントアクションは、入力として想定されるドキュメントの種別、抽出する項目、応答から除外する項目を定義します。項目を非表示にしたり、項目を必須とマークしたり、抽出する各項目で受け入れられる最小信頼度スコアを設定したり、自然言語を使用して質問することでデータ抽出プロセスが強化および改良されるようにプロンプトを設定したりできます。

信頼度スコアは、IDP がドキュメントから値を適切に抽出した確率を表します。たとえば、信頼度スコアが 100% の場合、IDP は完全な精度で値を抽出したことを意味します。ただし、信頼度スコアが 75% の場合は、抽出された値が正しくない可能性が 25% あることを意味します。

処理された各ドキュメントには、抽出された各項目の信頼度スコアが表示されます。この値が定義されたしきい値を下回る場合、抽出された値の精度を確認するために、ドキュメントは人間によるレビューに送信されます。各ドキュメントアクションに 1 人のレビュー担当者またはチームを追加できます。

IDP の概要は、Trailhead バッジ ( 「MuleSoft IDP Basics (MuleSoft IDP の基礎)」Leaving the Site​) (ログインが必要) を参照してください。Trailhead アカウントがない場合はサインアップしてください。

Einstein を使用したデータ抽出の強化

プロンプトをドキュメントアクションに追加するときに、デフォルトの応答を使用するのか、Einstein の応答を使用するのかを選択できます。Einstein は、項目を検索して抽出するだけでなくドキュメントをさらに分析する必要がある複雑な質問に回答できます。たとえば、税金を差し引いた後の請求書の未払い総額やドキュメントのその他の値を Einstein に尋ねることができます。

Einstein を使用して、標準形式を使用していない、または抽出されたデータの複雑な分析を実行しないと読み取ることが難しいドキュメント (運転免許証や傷病休暇の証明書など) を分析します。

IDP のドキュメント分析では、Salesforce Einstein プラットフォームの一部である Salesforce Einstein Trust Layer を介してアクセスする OpenAI の ​GPT4Omni_05_13​ LLM ゲートウェイモデルと予測モデルが Einstein で使用されます。

Einstein では、IDP のドキュメント分析のためのモデルのトレーニングに顧客データを使用しません。