Model Garden では、Vertex AI にデプロイして提供できるセルフデプロイのオープンモデルとパートナー モデルの両方が提供されています。これらのモデルは、サーバーレスで手動デプロイを必要としない model-as-a-service(MaaS)オファリングとは異なります。
モデルをセルフデプロイすると、 Google Cloud プロジェクトと VPC ネットワーク内で安全にデプロイされます。
オープンモデルをセルフデプロイする
オープンモデルは、マルチモーダル処理に優れた Gemini モデルなど、さまざまな AI タスクで事前トレーニング済みの機能を提供します。オープンモデルは無料で利用でき、その出力を自由に公開できます。また、ライセンス条項に従う限り、どこでも使用できます。Vertex AI では、オープン(オープン ウェイトとも呼ばれます)モデルとオープンソース モデルの両方を利用できます。
Vertex AI でオープンモデルを使用する場合は、インフラストラクチャに Vertex AI を使用することになります。オープンモデルは、PyTorch や Jax などの他のインフラストラクチャ プロダクトでも使用できます。
オープンウェイト モデル
オープンモデルの多くは、オープン ウェイトの大規模言語モデル(LLM)とみなされます。オープンモデルは、オープン ウェイトのないモデルよりも透明性が高くなります。モデルの重みとは、モデルのニューラル ネットワーク アーキテクチャに格納された数値のことで、モデルのトレーニングに使用されるデータから学習したパターンとの関係を表します。オープン ウェイト モデルで事前にトレーニングされたパラメータ(重み)は解放されます。推論とチューニングにオープン ウェイトモデルを使用できますが、元のデータセット、モデル アーキテクチャ、トレーニング コードなどの詳細情報は提供されません。
オープンソース モデル
オープンモデルはオープンソースの AI モデルとは異なります。オープンモデルでは、多くの場合に学習したパターンの重みとコア数値表現が公開されますが、ソースコード全体やトレーニングの詳細情報が提示されるわけではありません。重みを指定すると、AI モデルの透明性が高まり、モデルをご自分で構築しなくても、モデルの機能を理解できるようになります。
パートナーのモデルをセルフデプロイする
Model Garden を使用すると、独自モデルをセルフデプロイ オプションとして提供するパートナーからモデル ライセンスを購入して管理できます。Cloud Marketplace からモデルへのアクセスを購入した後、オンデマンド ハードウェアにデプロイするか、Compute Engine の予約と確約利用割引を使用して予算要件を満たすかを選択できます。モデルの使用量と、使用する Vertex AI インフラストラクチャに対して課金されます。
セルフデプロイ パートナー モデルの使用をリクエストするには、Model Garden コンソールで関連するモデルを見つけて [お問い合わせ] をクリックし、フォームに記入します。これにより、 Google Cloud 営業担当者との連絡が開始されます。
パートナー モデルのデプロイと使用の詳細については、パートナー モデルをデプロイして予測リクエストを行うをご覧ください。
考慮事項
セルフデプロイ パートナー モデルを使用する場合は、次の制限事項を考慮してください。
- オープンモデルとは異なり、重みをエクスポートすること����きま��ん。
- プロジェクトに VPC Service Controls が設定されている場合、モデルをアップロードできないため、パートナー モデルをデプロイできません。
- エンドポイントでは、共有パブリック エンドポイント タイプのみがサポートされています。
Vertex AI のセルフデプロイ モデルの詳細
- Model Garden の詳細については、Model Garden の概要をご覧ください。
- モデルのデプロイの詳細については、Model Garden でモデルを使用するをご覧ください。
- Gemma オープンモデルを使用する
- Llama のオープンモデルを使用する
- Hugging Face オープンモデルを使用する