BigLake

BigLake を使って Apache Iceberg レイクハウスを構築する

オープンでマネージドされた高パフォーマンスの Iceberg レイクハウスを構築し、自動化されたデータ マネジメントと組み込みのガバナンスによって、高度な分析とデータ サイエンスを有効にします。

Apache Iceberg は Apache Software Foundation の商標です。



機能

トランザクション データと分析データの相互運用

BigLake Metastore は、すべての Iceberg テーブルに対応するサーバーレス メタストアです。Apache Spark、BigQuery、サードパーティ プラットフォームなどのエンジンでテーブルを作成、管理するために使用でき、データの一貫したビューと統合されたアクセス制御を実現します。BigLake Metastore は、Apache Iceberg Rest カタログ(プレビュー版)をサポートし、OSS やサードパーティ エンジンとの統合を容易にします。Iceberg テーブルのデータに AlloyDB(プレビュー版)からアクセスできるようになり、トランザクション プラットフォームと分析プラットフォームの相互運用が可能になりました。

統合されたデータ マネジメントとガバナンス

BigLake は Google Cloud Storage の管理機能を拡張し、ストレージ自動クラスを使用してコールドデータの階層化を効率的に行うとともに、顧客管理の暗号鍵(CMEK)をストレージ バケットに適用できるようにします。BigLake メタストアは Dataplex ユニバーサル カタログにネイティブに統合され、一元的に定義されたガバナンス ポリシーが複数のエンジンで一貫して適用されるようにします。また、セマンティック検索、データリネージ、プロファイリング、品質チェックも可能になります。

BigQuery による高パフォーマンスの分析、ストリーミング、AI

Apache Iceberg 用の BigLake テーブルは、BigQuery と併用することで、エンタープライズ向けのフルマネージド Iceberg エクスペリエンスを提供します。Apache Iceberg データを独自の Google Cloud Storage バケットに保存し、BigQuery の高度に拡張可能なリアルタイム メタデータ管理機能を活用することで、GCS に関連するオープン性とデータ所有権、ストリーミング、高度な分析、AI ユースケース向けの Iceberg データによる BigQuery のフルマネージド機能へのアクセスという、両方の長所を活用できます。


仕組み

BigLake は、Cloud Storage 上の Apache Iceberg のネイティブ実装を提供します。ここでは、BigQuery または任意のオープンソース エンジンを Iceberg データで直接活用できます。BigLake Metastore はデータ マネジメントを簡素化し、Dataplex ユニバーサル カタログと統合して統一されたガバナンスを実現します。

一般的な使用例

Iceberg でオープンなレイクハウスを構築する

オープン データ レイクハウスの Google Cloud コンポーネントを理解する

BigLake で Iceberg レイクハウスを構築するには、まずデータを Cloud Storage に保存します。次に、Apache Iceberg 用の BigLake テーブルを使用してこのデータを定義します。BigLake Metastore は、これらの Iceberg テーブルの一元化されたサーバーレス カタログとして機能し、複雑なインフラストラクチャを管理する必要がなくなります。この設定により、Iceberg 対応のエンジンであればどれでも一貫してデータにアクセスして管理できるため、統合されたオープンで拡張可能なレイクハウス環境を簡単に構築できます。

    オープン データ レイクハウスの Google Cloud コンポーネントを理解する

    BigLake で Iceberg レイクハウスを構築するには、まずデータを Cloud Storage に保存します。次に、Apache Iceberg 用の BigLake テーブルを使用してこのデータを定義します。BigLake Metastore は、これらの Iceberg テーブルの一元化されたサーバーレス カタログとして機能し、複雑なインフラストラクチャを管理する必要がなくなります。この設定により、Iceberg 対応のエンジンであればどれでも一貫してデータにアクセスして管理できるため、統合されたオープンで拡張可能なレイクハウス環境を簡単に構築できます。

      BigQuery を使った高度な分析

      金融サービス向けのリアルタイムの分析情報と予測を提供

      Apache Iceberg は、トランザクションや市場フィードなどの進化するデータレイク データセットに使用できます。BigLake を使用すると、BigQuery で Iceberg テーブルをネイティブ ストレージと並行して、データ移動なしでクエリできます。リアルタイム ストリームを BigQuery に取り込み、BigLake を介して履歴 Iceberg データと組み合わせて、即座に包括的な分析を行うことができます。その後、BigQuery ML は、市場の変動性や不正行為の検出などのリアルタイムの分析情報と、信用リスクや顧客行動などの予測モデルを生成します。

        金融サービス向けのリアルタイムの分析情報と予測を提供

        Apache Iceberg は、トランザクションや市場フィードなどの進化するデータレイク データセットに使用できます。BigLake を使用すると、BigQuery で Iceberg テーブルをネイティブ ストレージと並行して、データ移動なしでクエリできます。リアルタイム ストリームを BigQuery に取り込み、BigLake を介して履歴 Iceberg データと組み合わせて、即座に包括的な分析を行うことができます。その後、BigQuery ML は、市場の変動性や不正行為の検出などのリアルタイムの分析情報と、信用リスクや顧客行動などの予測モデルを生成します。

          すべてのデータユーザーが単一のデータコピーを利用できるようにする

          BigLake は、Cloud Storage 内の 1 つのデータコピーに安全かつ一貫したアクセスを提供します。Dataplex ユニバーサル カタログは、このデータを自動的にカタログ化するため、すべてのデータユーザーとエンジンがアクセスできます。これにより、一貫性のあるデータ定義、簡単な検出、統合されたガバナンスが保証され、サイロが解消され、信頼できる唯一の情報源でのコラボレーションが促進されます。

            BigLake は、Cloud Storage 内の 1 つのデータコピーに安全かつ一貫したアクセスを提供します。Dataplex ユニバーサル カタログは、このデータを自動的にカタログ化するため、すべてのデータユーザーとエンジンがアクセスできます。これにより、一貫性のあるデータ定義、簡単な検出、統合されたガバナンスが保証され、サイロが解消され、信頼できる唯一の情報源でのコラボレーションが促進されます。

              ソリューションの生成
              解決したい問題は何ですか?
              What you'll get:
              手順ガイド
              リファレンス アーキテクチャ
              利用可能な事前構築済みソリューション
              このサービスは Vertex AI を使用して構築されました。ご利用いただけるのは 18 歳以上のユーザーのみです。機密情報や個人情報は入力しないでください。

              料金

              BigLake の料金の仕組みBigLake の料金は、テーブル管理、メタデータ ストレージ、メタデータ アクセスに基づいています
              サービスと用途説明価格(米ドル)

              BigLake テーブルの管理

              テーブル ストレージの自動最適化に使用される BigLake テーブル管理コンピューティング リソース。

              目安

              $0.12

              DCU 時間あたり

              BigLake メタデータ ストレージ

              BigLake Metastore では、保存されているメタデータに対して課金されます。無料枠には、1 か月あたり 1 GiB のメタデータ ストレージが含まれます。

              目安

              $0.04

              1 GiB あたりの月額

              BigLake メタデータ アクセス

              クラス A オペレーション: 書き込み、更新、一覧参照、作成、構成オペレーションに対する BigLake メタデータ アクセス料金。1 か月あたり 50,000 オペレーションの無料枠が含まれます。

              目安

              $6.00

              100 万オペレーションあたり

              クラス B オペレーション: 読み取り、取得、削除オペレーションに対する BigLake メタデータ アクセス料金。1 か月あたり 50,000 オペレーションの無料枠が含まれます。

              目安

              $0.90

              100 万オペレーションあたり

              BigLake の料金の仕組み

              BigLake の料金は、テーブル管理、メタデータ ストレージ、メタデータ アクセスに基づいています

              BigLake テーブルの管理

              説明

              テーブル ストレージの自動最適化に使用される BigLake テーブル管理コンピューティング リソース。

              価格(米ドル)

              Starting at

              $0.12

              DCU 時間あたり

              BigLake メタデータ ストレージ

              説明

              BigLake Metastore では、保存されているメタデータに対して課金されます。無料枠には、1 か月あたり 1 GiB のメタデータ ストレージが含まれます。

              価格(米ドル)

              Starting at

              $0.04

              1 GiB あたりの月額

              BigLake メタデータ アクセス

              説明

              クラス A オペレーション: 書き込み、更新、一覧参照、作成、構成オペレーションに対する BigLake メタデータ アクセス料金。1 か月あたり 50,000 オペレーションの無料枠が含まれます。

              価格(米ドル)

              Starting at

              $6.00

              100 万オペレーションあたり

              クラス B オペレーション: 読み取り、取得、削除オペレーションに対する BigLake メタデータ アクセス料金。1 か月あたり 50,000 オペレーションの無料枠が含まれます。

              説明

              Starting at

              $0.90

              100 万オペレーションあたり

              料金計算ツール

              リージョン固有の料金と手数料を含む、BigLake の毎月の費用を試算する

              カスタムの見積もり

              カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。

              概念実証を開始する

              レイクハウス ジャンプスタート ソリューション

              大規模なプロジェクトがある場合は、

              Apache Iceberg 用の BigLake テーブル

              オープンソース メタデータを管理する

              Apache Iceberg データにクエリを実行する

              Google Cloud