ドキュメント処理の使用開始

IDP でドキュメントを分析する前に、ドキュメントアクション (ドキュメントの処理に必要な指示を含む設定可能なスキーマ定義) を作成してパブリッシュする必要があります。

ドキュメントアクションを Anypoint Exchange にパブリッシュしたら、IDP API をプログラムでコールしてドキュメントアクションを実行し、ドキュメントからデータを抽出できます。その結果、ドキュメントアクションは指定されたドキュメントを分析し、抽出されたすべての項目を含む JSON 形式で応答を返します。IDP API を照会すれば、実行の状況をいつでも確認できます。

ドキュメントアクション

ドキュメントアクション​は、複数の AI エンジンを使用するマルチステッププロセスで、ドキュメントをスキャンし、項目を除外して、構造化された応答を JSON オブジェクトとして返します。各ドキュメントアクションは、入力として想定されるドキュメントの種別、抽出する項目、応答から除外する項目を定義します。

IDP には、カスタムドキュメントアクションを作成するための事前設定済みの ​[Invoice (請求書)]​ および ​[Purchase Order (購入注文)]​ テンプレートが用意されています。各テンプレートには、ドキュメントから構造化された応答に抽出される一連の項目が含まれています。新しいドキュメントアクションを作成するときに、処理するドキュメントに最も適した種別を選択します。たとえば、​[Invoice (請求書)]​ 種別では、請求書、領収書、および同様のドキュメントを処理できます。どちらの種別もドキュメントに適さない場合は、​[Generic (汎用)]​ 種別を使用して、自然言語で質問して抽出するように項目を完全にカスタマイズします。

ドキュメントアクション設定を定義して、データ抽出時に使用する大規模言語モデル (LLM) を選択し、PII マスキングまたは画像認識を有効にします。IDP では、次のモデルがサポートされています。

  • OpenAI の ​GPT-4o (gpt-4o-2024-08-06)​ LLM

  • OpenAI の ​GPT-4o Mini (gpt-4o-mini-2024-07-18)​ LLM

  • Google の ​GEMINI-2.0 Flash 001​ LLM

ドキュメントアクションを作成したら、Anypoint Exchange にパブリッシュして、RPA から IDP API 経由で使用できるようにします。

レビュー

ドキュメントアクションは、抽出された項目と検出された値を含む JSON 応答を返します。各値には、抽出中の値の精度を決定する信頼度スコアがあります。

ドキュメントは、次のいずれかの条件を満たすと、レビューのキューに追加されます。

  • 非表示でない項目の 1 つ以上で、信頼度スコアが設定されたしきい値を下回っている。

  • 必須とマークされた非表示でない項目の 1 つ以上が見つからない、または抽出できなかった。

レビュー担当者が結果を確認して承認すると、実行状況は ​SUCCEEDED​ に変わります。可能な状況とその定義については、​「実行状況リファレンス」​を参照してください。

IDP API

パブリッシュ済みのドキュメントアクションの実行をトリガーし、IDP API を使用して指定されたドキュメントを分析して実行結果を照会できます。IDP API をコールするように接続アプリケーションを設定する必要があります。

設定と使用方法については、API を使用したドキュメントの処理と結果の取得を参照してください。

IDP と RPA のインテグレーション

MuleSoft RPA から [Submit Document to MuleSoft IDP (ドキュメントを MuleSoft IDP に送信)] アクションステップと [Retrieve Results from MuleSoft IDP (MuleSoft IDP から結果を取得)] アクションステップを使用して、パブリッシュ済みドキュメントアクションを実行して結果を照会できます。IDP をコールするように接続アプリケーションを設定し、RPA で使用できるようにドキュメントアクションをパブリッシュする必要があります。

設定と使用方法については、RPA を使用したドキュメントの処理と結果の取得を参照してください。