Google BigQuery Connector リファレンス

Google BigQuery は、データを保管してアクセスするためのウェアハウスであり、データセットをリアルタイムで分析するためのツールも提供しています。

始める前に

  • Google BigQuery Connector を使用するには、 Google ワークスペースLeaving the Site​のアカウントが必要です。コンポーザーから個人の Google アカウントへの接続は許可されません。

    Google ワークスペースのアカウントに接続すると、コンポーザーが 未確認のアプリケーションLeaving the Site​であることを示すメッセージが表示されます。これは想定される動作です。このメッセージをバイパスしてコネクタを使用するには、​「このアプリは Google で確認されていません」​のダイアログで ​[詳細]​ ​> [[プロジェクト名](安全ではないページ) に移動] > [許可]​ をクリックします。

  • Google BigQuery Connector では、Google の制限されたデータにアクセスするために、サードパーティアプリケーションのアクセス権が必要です。コネクタを使用する前に、Google ワークスペース管理者は、 設定されたアプリケーションのリストに次のクライアント ID を追加Leaving the Site​して、コンポーザーとの OAuth 接続を作成する必要があります。

    292130641403-rlgmr379unk36nuvpba0sd1u3u9c6vap.apps.googleusercontent.com

接続

システムに接続するには、それがデータの取得元であるかデータの取得先であるかに関係なく、そのシステムに必要なログイン情報を使用して接続を作成する必要があります。通常、フロー内の異なるシステムに接続し、接続が必要になるたびに各接続を再利用できます。

このシステムでは、接続のために次のログイン情報が必要です。

Connection Display Name (接続表示名)

この接続の詳細を把握するのに役立つ接続名を入力します。 1 つのフローおよび複数のフローで接続を複数回再利用できます。接続の作成後、ログイン情報は非表示になります。そのため、この接続を他の接続と簡単に区別できる名前を付けると役立ちます。

接続は自分にのみ表示されます。コンポーザーアプリケーションの他のユーザーは、独自の接続を作成する必要があります。

Project ID (プロジェクト ID)

Google BigQuery から取得したプロジェクト ID。

Username (ユーザー名)

Google BigQuery にログインするために使用する OAuth ユーザー名。

Password (パスワード)

Google BigQuery にログインするために使用する OAuth パスワード。

データ型

Google BigQuery では、次のデータ型がサポートされています。

  • INT64

  • BIGNUMERIC

  • BOOL

  • BYTES

  • DATE

  • DATETIME

  • FLOAT64

  • JSON

  • NUMERIC

  • STRING

  • TIME

  • TIMESTAMP

Triggers (トリガー)

各フローは、​スケジューラー​または​トリガー​によって開始します。スケジューラーはデフォルトの頻度である 15 分に設定されます。トリガー (例:「each time a new record is created (新規レコードが作成されるたび)」) はユーザーが定義し、システム内のデータに関連する複数のオプションがあります。

トリガーは、ポーリングプロセスを使用して外部システムからの最新情報を能動的にチェックします。ポーリングの頻度は 15 秒に 1 回です。

このシステムでは、次のトリガーオプションが提供されます。

特定のプロジェクト ID では、US ベースのデータセットが取得されます。
On New Row Source (新規行のソース)

15 秒ごとにウォーターマークに基づいてテーブルのすべての新しい行を返します。次の項目の値を指定します。

  • Dataset name (データセット名)

  • Table name (テーブル名)

  • New Watermark Column (新規ウォーターマーク列)​: この項目では、次の列のデータ型を使用できます。

    • DATE

    • DATETIME

On New or Updated Row Source (新規または更新済み行のソース)

15 秒ごとにウォーターマークに基づいてテーブルのすべての新しい行または更新された行を返します。次の項目の値を指定します。

  • Dataset name (データセット名)

  • Table name (テーブル名)

  • New Watermark Column (新規ウォーターマーク列)​: この項目では、次の列のデータ型を使用できます。

    • DATE

    • DATETIME

  • Update Watermark Column (更新ウォーターマーク列)​: この項目では、次の列のデータ型を使用できます。

    • DATE

    • DATETIME

Polling Frequency (ポーリング頻度)

このコネクタのトリガーでは、​[Polling Frequency (ポーリング頻度)]​ 項目が必須です。この項目により、アクティブなフローのレコードの変更を検索するためにコンポーザーが基盤となるシステム API に対して要求を実行する頻度を選択できます。組織のフローごとに異なるポーリング頻度を選択できます。頻度が短くなると、フローの実行頻度は高くなりますが、より多くの ​『API コール』​がコンシュームされます。たとえば、注文管理フローがある場合、15 秒のポーリング間隔 (5760 API コール/日) で達成できるほぼリアルタイムの更新が必要になる可能性があります。これに対して、フローで価格設定カタログを更新する場合、1 時間ごと (24 API コール/日) にフローをポーリングすれば済みます。

アクション

システムに接続してトリガーを定義するか、スケジューラーを設定した後に、フローが実行するアクション (Workday から Salesforce へのレコードのコピーなど) を定義します。実行できるアクションは、接続しているシステムによって異なります。

このシステムでは次のアクションが提供されます。

Insert Rows

1 つ以上の行をテーブルに挿入してテーブルを更新します。​[SQL string (SQL 文字列)]​ の値を指定します。

Update Rows

行のセットを更新します。​[SQL string (SQL 文字列)]​ の値を指定します。

Delete Rows

行のセットを削除します。​[SQL string (SQL 文字列)]​ の値を指定します。

Select Rows

行のセットを取得します。​[SQL string (SQL 文字列)]​ の値を指定します。

Input Parameters (入力パラメーター)

クエリステートメントにパラメーター値を含めるには、​:​ に続けてパラメーター名を指定します (例: Select field from dataset.table where field = :param1​)。パラメーターの値は ​[Input Parameters (入力パラメーター)]​ セクションで定義します。たとえば、​param1​ の値を ​12345​ として定義すると、このクエリステートメントは ​Select field from dataset.table where field = 12345​ として解釈されます。

パラメーターの値は、リテラル文字列、または先行するアクションの出力値として定義する必要があります。String (文字列) または Date (日付) データ型の入力パラメーター値は、式エディターを使用して、単一引用符で囲んで指定する必要があります。リテラル文字列の場合は、エディターで単一引用符を ​’12345’​ のように値に追加します。先行するアクションからの出力値の場合は、カスタム式オプションを選択し、エディターでカスタム式を ​’Field From Previous Step’​ のように単一引用符で囲んで、変更を適用します。

Google BigQuery™ は Google LLC の商標です。