IDP の概要

MuleSoft インテリジェントドキュメント処理 (IDP) を使用すると、請求書、購入注文、その他の非構造化ドキュメントや半構造化ドキュメントを読み取り、AI 機能を使用して抽出されたコンテンツを分析および絞り込んで構造化された応答を作成できます。IDP では、テキストと画像を解釈できるマルチモーダル大規模言語モデル (LLM) がサポートされています。

シンプルな IDP インターフェースでは、外部サービスにサブスクライブしなくても、RPA、Mule アプリケーション、その他のシステムとのインテグレーションで使用するドキュメントアクションを作成し、API としてパブリッシュできます。

ドキュメントアクション​は、複数の AI エンジンを使用するマルチステッププロセスで、ドキュメントをスキャンし、項目を除外して、構造化された応答を JSON オブジェクトとして返します。各ドキュメントアクションは、入力として想定されるドキュメントの種別、抽出する項目、応答から除外する項目を定義します。

次のような自然言語での質問を使用して、ドキュメントから特定のデータを抽出するプロンプトを設定します。

  • What is the subtotal amount? (小計金額はいくらですか?)

  • What is the grand total? (総計は何ですか?)

  • When is the due date? (期日はいつですか?)

  • What is the highest price? (最高価格はいくらですか?)

信頼度スコアは、IDP がドキュメントから値を適切に抽出した確率を表します。たとえば、信頼度スコアが 100% の場合、IDP は完全な精度で値を抽出したことを意味します。ただし、信頼度スコアが 75% の場合は、抽出された値が正しくない可能性が 25% あることを意味します。

処理された各ドキュメントには、抽出された各項目の信頼度スコアが表示されます。この値が定義されたしきい値を下回る場合、抽出された値の精度を確認するために、ドキュメントは人間によるレビューに送信されます。各ドキュメントアクションに 1 人のレビュー担当者またはチームを追加できます。

IDP の概要は、Trailhead バッジ ( 「MuleSoft IDP Basics (MuleSoft IDP の基礎)」​) (ログインが必要) を参照してください。Trailhead アカウントがない場合はサインアップしてください。

カスタムユーザー定義スキーマを使用したドキュメントの分析

任意の種別のドキュメントを分析し、汎用ドキュメントアクションを作成して ​[Customize Schema (スキーマをカスタマイズ)]​ を有効にすることで出力構造を完全にカスタマイズします。Einstein でドキュメントの分析と各項目のデータの抽出を行うことができるように、出力構造の項目およびテーブルを定義して手順を設定できます。

Einstein では、次の予測モデルがサポートされています。

  • OpenAI の ​GPT-4o (gpt-4o-2024-08-06)​ LLM

  • OpenAI の ​GPT-4o Mini (gpt-4o-mini-2024-07-18)​ LLM

  • Google の ​GEMINI-2.0 Flash 001​ LLM

Einstein は、Salesforce Einstein プラットフォームの一部である Salesforce Einstein Trust Layer を介してこれらのモデルにアクセスします。

ドキュメントアクションエディターの ​[Settings (設定)]​ をクリックして、ドキュメント分析時に使用するモデルを選択します。

2 月 5 日より前に作成されたドキュメントアクションでは、OpenAI の ​GPT-4o (gpt-4o-2024-05-13)​ のみがサポートされます。モデル選択と新しいモデルを有効にするには、新しいドキュメントアクションを作成してください。使用可能な機能と設定についての詳細は、​「ドキュメントアクション設定を定義する」​を参照してください。

Einstein を使用したデータ抽出の強化

プロンプトを請求書または購入注文ドキュメントアクションに追加するときに、デフォルトの自然言語処理モデル (IDP NLP) を使用して各プロンプトの回答を生成するのか、Einstein を使用してその作業を行うのかを選択できます。Einstein は、項目を検索して抽出するだけでなくドキュメントをさらに分析する必要がある複雑な質問に回答できます。たとえば、税金を差し引いた後の請求書の未払い総額やドキュメントのその他の値を Einstein に尋ねることができます。

Einstein を使用して、標準形式を使用していない、または抽出されたデータの複雑な分析を実行しないと読み取ることが難しいドキュメント (運転免許証や傷病休暇の証明書など) を分析します。

Einstein では、IDP のドキュメント分析のためのモデルのトレーニングに顧客データを使用しません。