Defina o idioma do comando de texto

Experimente a geração de imagens (Vertex AI Studio)

Experimente o Imagen num Colab

Esta página descreve como pode definir um parâmetro opcional do Imagen no Vertex AI para especificar o idioma do comando que usa. Se não especificar um idioma, o Imagen deteta automaticamente o idioma.

Uma imagem de um livro gerada a partir de um comando em hindi
Imagem gerada a partir do comando: ऊपर से देखा गया किताबों का ढेर। सबसे ऊपरी पुस्तक में एक पक्षी का जलरंग चित्रण है। किताब पर VERTEX AI मोटे अक्षरों में लिखा हुआ है 1

1 Uma pilha de livros vista de cima. O livro mais acima contém uma ilustração em aguarela de um pássaro. VERTEX AI está escrito em letras a negrito no livro.
Uma imagem de uma mulher a partir de um comando em coreano
Imagem gerada a partir do comando: 어두운 노란색과 청록색으로 이루어진 밝은 색의 옷을입고 귀걸이를 끼고���는 여자 포스트 모던 패션 사진 2

2 Mulher com cores brilhantes, no estilo de amarelo escuro e ciano escuro, com brincos, fotografia de moda pós-moderna.

Defina o idioma do comando de texto

Os seguintes valores de entrada são suportados para o idioma do comando de texto:

  • Chinês (simplificado) (zh/zh-CN)
  • Chinês (tradicional) (zh-TW)
  • Inglês (en, valor predefinido)
  • Francês (fr)
  • Alemão (de)
  • Hindi (hi)
  • Japonês (ja)
  • Coreano (ko)
  • Português (pt)
  • Espanhol (es)

Consola

Se o seu comando estiver num dos idiomas suportados, o Imagen deteta e traduz o texto e devolve as imagens geradas ou editadas.

Se o comando estiver num idioma não suportado, o Imagen usa o texto verbatim para o pedido. Isto pode resultar numa saída inesperada.

REST

Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:

  • PROJECT_ID: o seu Google Cloud ID do projeto.
  • TEXT_PROMPT: o comando de texto que orienta as imagens que o modelo gera. Este campo é obrigatório para a geração e a edição.
  • PROMPT_LANGUAGE: string. Opcional. O código do idioma que corresponde ao idioma do comando de texto. Neste exemplo, seria hi. Valores disponíveis:
    • auto – Deteção automática. Se o Imagen detetar um idioma suportado, o comando (e, opcionalmente, um comando negativo) é traduzido para inglês. Se o idioma detetado não for suportado, o Imagen usa o texto de entrada na íntegra, o que pode resultar num resultado inesperado. Não é devolvido nenhum código de erro.
    • en – Inglês (valor predefinido se for omitido)
    • es – Espanhol
    • hi - Hindi
    • ja – Japonês
    • ko – Coreano
    • pt – Português
    • zh-TW – Chinês (tradicional)
    • zh ou zh-CN – Chinês (simplificado)

Método HTTP e URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict

Corpo JSON do pedido:

{
  "instances": [
    {
      "prompt": "सूर्यास्त के समय एक समुद्र तट। उड़ते पक्षी, हवा में लहराते नारियल के पेड़। लोग समुद्र तट पर सैर का आनंद ले रहे हैं।"
    }
  ],
  "parameters": {
    "language": "PROMPT_LANGUAGE"
  }
}

Para enviar o seu pedido, escolha uma destas opções:

curl

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict"

PowerShell

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict" | Select-Object -Expand Content
A seguinte resposta de exemplo destina-se a um pedido com "sampleCount": 2. A resposta devolve dois objetos de previsão com os bytes da imagem gerada codificados em base64.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

O que se segue?