Untuk menggunakan library Python OpenAI, instal OpenAI SDK:
pip install openai
Untuk mengautentikasi dengan Chat Completions API, Anda dapat mengubah penyiapan klien atau mengubah konfigurasi lingkungan untuk menggunakan autentikasi Google dan endpoint Vertex AI. Pilih metode yang lebih mudah, lalu ikuti langkah-langkah penyiapan, bergantung pada apakah Anda ingin memanggil model Gemini atau model Model Garden yang di-deploy sendiri.
Model tertentu di Model Garden dan
model Hugging Face yang didukung
harus
di-deploy ke endpoint Vertex AI
terlebih dahulu sebelum dapat melayani permintaan.
Saat
memanggil model yang di-deploy sendiri ini dari Chat Completions API, Anda perlu
menentukan ID endpoint. Untuk mencantumkan
endpoint Vertex AI yang ada, gunakan
perintah gcloud ai endpoints list
.
Penyiapan klien
Untuk mendapatkan kredensial Google secara terprogram di Python, Anda dapat menggunakan
google-auth
Python SDK:
pip install google-auth requests
Python
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Python di Panduan memulai Vertex AI menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Python Vertex AI.
Untuk melakukan autentikasi ke Vertex AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Secara default, masa berlaku token akses akun layanan adalah 1 jam. Anda dapat
memperpanjang masa aktif token akses akun layanan
atau memperbarui token secara berkala dan memperbarui variabel openai.api_key
.
Variabel lingkungan
Menginstal Google Cloud CLI. Library OpenAI dapat membaca variabel lingkungan OPENAI_API_KEY
dan OPENAI_BASE_URL
untuk mengubah autentikasi dan endpoint di klien defaultnya.
Tetapkan variabel berikut:
$ export PROJECT_ID=PROJECT_ID
$ export LOCATION=LOCATION
$ export OPENAI_API_KEY="$(gcloud auth application-default print-access-token)"
Untuk memanggil model Gemini, tetapkan variabel MODEL_ID
dan gunakan endpoint openapi
:
$ export MODEL_ID=MODEL_ID
$ export OPENAI_BASE_URL="https://${LOCATION}-aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/${LOCATION}/endpoints/openapi"
Untuk memanggil model yang di-deploy sendiri dari Model Garden, tetapkan variabel ENDPOINT
dan gunakan variabel tersebut di URL Anda:
$ export ENDPOINT=ENDPOINT_ID
$ export OPENAI_BASE_URL="https://${LOCATION}-aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/${LOCATION}/endpoints/${ENDPOINT}"
Selanjutnya, lakukan inisialisasi klien:
client = openai.OpenAI()
Gemini Chat Completions API menggunakan OAuth untuk melakukan autentikasi
dengan
token akses yang berlaku singkat.
Secara default, masa berlaku token akses akun layanan adalah 1 jam. Anda dapat
memperpanjang masa aktif token akses akun layanan
atau memperbarui token secara berkala dan memperbarui variabel openai.api_key
.
Memperbarui kredensial Anda
Contoh berikut menunjukkan cara memperbarui kredensial Anda secara otomatis sesuai kebutuhan:
Python
Langkah berikutnya
- Lihat contoh panggilan ke Chat Completions API dengan sintaksis yang kompatibel dengan OpenAI.
- Lihat contoh panggilan Inference API dengan sintaksis yang kompatibel dengan OpenAI.
- Lihat contoh pemanggilan Function Calling API dengan sintaks yang kompatibel dengan OpenAI.
- Pelajari Gemini API lebih lanjut.
- Pelajari lebih lanjut cara bermigrasi dari Azure OpenAI ke Gemini API.