関係データのグラフ基礎モデル ノート

関係データのグラフ基礎モデル

関係データベースは、企業のデータ形式で広く使用されており、多くの予測サービスを支えています。しかし、伝統的な機械学習方法は、これらの関係スキーマの接続構造を完全に活用することができません。グラフニューラルネットワーク(GNN)は、グラフ構造化されたデータに適していますが、ほとんどのGNNは特定のグラフに固定されており、新しいノード、エッジの種類、特徴、ノードラベルを持つ新しいグラフに一般化できません。目的は、相互接続された関係テーブルで優秀な性能を示し、任意のテーブル、特徴、タスクに一般化できる単一のモデルを設計することです。これは、関係テーブルを単一のヘテロジニアスグラフに変換することで達成できます。各テーブルは、ユニークなノードタイプになり、各テーブルの行はノードになります。グラフファンデーションモデル(GFM)は、1つのグラフでトレーニングを行い、構造やスキーマの違いにかかわらず、任意の未見グラフで推論を行うことができます。主要な課題は、任意のデータベーススキーマを符号化するための移植可能な方法と、ノード特徴を処理する方法の作成です。結果は、GFMが従来のタブラーのベースラインに対して顕著な性能向上をもたらすことを示し、データの構造を活用することで、人工知能における広範囲のアプリケーション向けのMLモデルを改善することができます。
CdXz5zHNQW_7H5UMxH7tS.png