ピンタレストでのGokuタイムシリーズデータベースの効率改善 (第3部)
グーグー、Pinterestの時系列データベースは、グーグー・ショート・ターム(グーグーS)、グーグー・ロング・ターム(グーグーL)、グーグー・コンパクター、グーグー・ルートのサブコンポーネントで構成されています。Pinterestは、観察可能性チームのために2つの機能を実装し、コスト削減を実現しました:メトリクス・ネームスペースは、異なるメトリクス・ファミリーに対する柔軟なストレージ・コンフィギュレーションを許可し、Top Write Heavy Metricsの提供は、ブロックされるメトリクスを特定し、グーグーSに格納されるデータを削減します。グーグーS、コンパクター、インジェスターのアーキテクチャー変更は、リソース・フットプリントの削減を目的としています。メトリクス・ネームのインデックス改善は、メトリクス・ネームのストレージを最適化し、プロセス・メモリーの消費を大幅に削減しました。コンパクション改善は、メトリクス・ネームを辞書エンコーディングで表現し、メモリー使用量を削減しました。プロセス・メモリーの分析とクラスター・マシン・ハードウェアの評価は、適切なインスタンス・タイプの決定に役立ちました。グーグーSのメトリクス・ネームのメモリー消費量が、インデックス改善後、ホストあたり約9GB削減しました。観察可能性チームは、グーグーの機能を使用して、グーグーSに格納される時系列データを37%削減しました。グーグーLホストのディスク使用量が、約27%削減しました。これらの最適化により、Pinterestは大量のメトリクス・データをコスト効果的に格納し、処理することができます。