Use o reescritor de comandos

Experimente a geração de imagens (Vertex AI Studio)

Experimente o Imagen num Colab

O Imagen no Vertex AI oferece uma ferramenta de reescrita de comandos baseada em MDIs/CEs, também conhecida como reescritor de comandos. A reescrita de comandos ajuda a obter imagens de saída de maior qualidade adicionando mais detalhes ao comando.

Se desativar a reescrita de comandos, a qualidade das imagens e a semelhança do resultado com o comando que forneceu podem ser afetadas. Esta funcionalidade está ativada por predefinição para as seguintes versões do modelo:

  • imagen-4.0-generate-001
  • imagen-4.0-fast-generate-001
  • imagen-4.0-ultra-generate-001
  • imagen-3.0-generate-002

O comando reescrito é fornecido pela resposta da API apenas se o comando original tiver menos de 30 palavras.

Use o reescritor de comandos

Para usar a reescrita de comandos, faça o seguinte:

Consola

  1. Na Google Cloud consola, aceda à página Vertex AI > Media Studio.

    Aceda ao Media Studio

  2. Clique em Imagen. A página de geração de imagens do Imagen Media Studio é apresentada.

  3. No painel Definições, ajuste as seguintes opções:

    • Modelo: escolha um modelo entre as opções disponíveis.

      Para mais informações sobre os modelos disponíveis, consulte os modelos Imagen

    • Número de resultados: ajuste o controlo de deslize ou introduza um valor entre 1 e 4.

    • Na caixa Comando negativo, introduza um comando que descreva o que não quer que seja gerado na imagem.

  4. Na caixa Escreva o seu comando, clique em Ajuda-me a escrever.

    É apresentada a janela Melhorar o meu comando.

  5. Na caixa Comando atual, escreva o seu comando e, de seguida, clique em Melhorar.

    O comando reescrito é apresentado na caixa Comando melhorado. Pode editar o comando melhorado ou usá-lo tal como é apresentado.

  6. Clique em Inserir para usar o comando apresentado.

    O comando é inserido na caixa Escreva o seu comando.

  7. Clique em Gerar.

REST

Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:

  • PROJECT_ID: o seu Google Cloud ID do projeto.
  • MODEL_VERSION: a versão do modelo de geração de imagens a usar.

    Para mais informações sobre as versões e as funcionalidades dos modelos, consulte o artigo Versões dos modelos.

  • LOCATION: a região do seu projeto. Por exemplo, us-central1, europe-west2 ou asia-northeast3. Para ver uma lista das regiões disponíveis, consulte Localizações da IA generativa na Vertex AI.
  • TEXT_PROMPT: o comando de texto que orienta as imagens que o modelo gera. Antes de as imagens serem geradas, este comando base é melhorado com mais detalhes e linguagem descritiva através da ferramenta de reescrita de comandos baseada em GMLs.
  • IMAGE_COUNT: um número inteiro que descreve o número de imagens a gerar. Os valores aceites são 1-4. O valor predefinido é 4.
  • PROMPT_SETTING: um valor booleano. true ativa os comandos melhorados e false desativa-os. O valor predefinido é true.

Método HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

Corpo JSON do pedido:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "enhancePrompt": PROMPT_SETTING
  }
}

Para enviar o seu pedido, escolha uma destas opções:

curl

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
Com o melhoramento de comandos ativado, a resposta inclui um campo prompt adicional que mostra o comando melhorado e a imagem gerada associada:
  {
    "predictions": [
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_1",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
      },
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_2",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
      }
    ]
  }

Por exemplo, a seguinte resposta de exemplo destina-se a um pedido com "sampleCount": 2 e "prompt": "A raccoon wearing formal clothes, wearing a top hat. Oil painting in the style of Vincent Van Gogh.". A resposta devolve dois objetos de previsão, cada um com o respetivo comando melhorado e os bytes da imagem gerada codificados em base64.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh,
        depicting a raccoon adorned in a finely tailored tuxedo, complete with a
        crisp white shirt and a bow tie. The raccoon also sports a classic top
        hat, perched jauntily on its head. The painting uses thick, swirling
        brushstrokes characteristic of van Gogh, with vibrant hues of blue,
        yellow, and green in the background, contrasting with the dark tones of
        the raccoon's attire. The light source is subtly placed, casting a
        dramatic shadow of the raccoon's attire onto the surface it sits upon,
        further enhancing the depth and dimensionality of the composition. The
        overall impression is one of a whimsical and sophisticated character, a
        raccoon elevated to a higher class through its formal attire, rendered
        in van Gogh's iconic style.",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh featuring
        a raccoon in a dapper suit, complete with a black jacket, crisp white
        shirt, and a black bow tie. The raccoon is wearing a black top hat,
        adding a touch of elegance to its ensemble. The painting is rendered
        with characteristic van Gogh brushwork, utilizing thick, impasto strokes
        of color. The background is a swirl of blues, greens, and yellows,
        creating a vibrant yet slightly chaotic atmosphere that contrasts with
        the raccoon's formal attire. The lighting is dramatic, casting sharp
        shadows and highlighting the textures of the fabric and the raccoon's
        fur, enhancing the sense of realism within the fantastical scene. The
        composition focuses on the raccoon's proud posture, highlighting the
        whimsical contrast of a wild animal dressed in formal attire, captured
        in the unique artistic language of van Gogh. ",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

O que se segue?