Vertex AI 上的 Qwen 模型提供全代管的無伺服器模型,並以 API 形式提供。如要在 Vertex AI 上使用 Qwen 模型,請直接將要求傳送至 Vertex AI API 端點。由於 Qwen 模型使用受管理 API,因此不需要佈建或管理基礎架構。
您可以串流回應,減少使用者感受到的延遲時間。串流回應會使用伺服器推送事件 (SSE) 逐步串流回應。
可用的 Qwen 模型
您可以在 Vertex AI 中使用 Qwen 的下列模型。如要存取 Qwen 模型,請前往 Model Garden 的模型資訊卡。
Qwen3-Next-80B Instruct
Qwen3-Next-80B Instruct 是 Qwen3-Next 系列語言模型。這項模型專門用來執行特定指令,以及處理非常長的文字。Gemini 1.5 Pro 採用名為「專家混合」(MoE) 的智慧設計,可啟用部分可用參數來處理資訊,因此執行速度比其他同等大小的模型更快,也更具成本效益。
Instruct 版本經過調整,可在即時通訊和代理程式應用程式中提供可靠的直接回覆,且具備大型內容視窗,可將整個對話或大型文件保留在記憶體中。
前往 Qwen3-Next-80B Instruct 模型資訊卡
Qwen3-Next-80B Thinking
Qwen3-Next-80B Thinking 是 Qwen3-Next 系列模型中的語言模型。專門用於解決複雜問題和深入推理。「思考」模式會顯示逐步推論過程和最終答案,因此非常適合需要透明邏輯的工作,例如數學證明、複雜的程式碼偵錯,或多步驟的代理規劃。
前往 Qwen3-Next-80B Thinking 模型資訊卡
Qwen3 Coder (Qwen3 Coder)
Qwen3 Coder (Qwen3 Coder
) 是專為進階軟體開發工作設計的大型開放權重模型。這項模型的主要特色是大型脈絡窗口,可全面處理及瞭解大型程式碼庫。
Qwen3 235B (Qwen3 235B)
Qwen3 235B (Qwen3 235B
) 是大型 235B 參數模型,這項模型以「混合思考」功能為特色,可讓使用者在有條不紊、逐步「思考」模式之間動態切換,以處理數學推理和編碼等複雜工作,以及快速「非思考」模式,以進行一般用途的對話。由於脈絡窗口較大,因此適合需要深入推理和理解長篇內容的用途。
事前準備
如要在 Vertex AI 中使用 Qwen 模型,請按照下列步驟操作。如要使用 Vertex AI,必須啟用 Vertex AI API (aiplatform.googleapis.com
)。如果您已有啟用 Vertex AI API 的專案,可以改用該專案,不必建立新專案。
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. - 前往下列任一 Model Garden 模型資訊卡,然後按一下「啟用」。