異なるデータベースに年別に同じ構造のデータが保存されている場合、クロスベースの混合ソース計算が必要です。異なるストレージシステムでのデータの結合は、データの取得方法が異なることを除いて、一般的に似ています。この例では、2つのデータベース、dbaとdbbへの接続を設定し、混合計算では両方のテーブルのデータを結合してから計算を実行します。`@x`オプションは、クエリーの後でデータベースの接続を閉じ、`|`記号を使用してデータを結合します。結合されたデータセットに対して集計を実行することができます。重複データの処理は重要であり、`group@1`を使用してキーによるソート後の重複を破棄します。混合ソース計算により、データベース間のデータ比較タスク、例えば共通のレコードや一意のレコードの検索が可能になります。完全結合、交差、差分は、特定の関数を使用して実現できます。大容量のデータセットの場合、SPLのカーソルメカニズムを使用して混合ソース計算を実行します。カーソルを連結して直接処理するか、`CS.merge()`関数を使用して結合、交差、差分のオプションを提供します。カーソルに対する計算は、最終的な集計ステップで開始します。単一のカーソル遍歴に対する複数の操作を処理するために、SPLのカーソル再使用(チャネル)メカニズムを使用します。結果がメモリーに収まらない場合は、ファイルにエクスポートすることができます。SPLは、クロスデータベースとクロスソースの計算目標をサポートし、GitHub上にソースコードが公開されています。
dev.to
Cross-datasource union and comparison:SPL Lightweight Multisource Mixed Computation Practices #5
