Experimente a geração de imagens (Vertex AI Studio)
Experimente o Imagen num Colab
O Imagen no Vertex AI oferece uma ferramenta de reescrita de comandos baseada em MDIs/CEs, também conhecida como reescritor de comandos. A reescrita de comandos ajuda a obter imagens de saída de maior qualidade adicionando mais detalhes ao comando.
Se desativar a reescrita de comandos, a qualidade das imagens e a semelhança do resultado com o comando que forneceu podem ser afetadas. Esta funcionalidade está ativada por predefinição para as seguintes versões do modelo:
imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-4.0-ultra-generate-001
imagen-3.0-generate-002
O comando reescrito é fornecido pela resposta da API apenas se o comando original tiver menos de 30 palavras.
Use o reescritor de comandos
Para usar a reescrita de comandos, faça o seguinte:
Consola
Na Google Cloud consola, aceda à página Vertex AI > Media Studio.
Clique em Imagen. A página de geração de imagens do Imagen Media Studio é apresentada.
No painel Definições, ajuste as seguintes opções:
Modelo: escolha um modelo entre as opções disponíveis.
Para mais informações sobre os modelos disponíveis, consulte os modelos Imagen
Número de resultados: ajuste o controlo de deslize ou introduza um valor entre 1 e 4.
Na caixa Comando negativo, introduza um comando que descreva o que não quer que seja gerado na imagem.
Na caixa Escreva o seu comando, clique em Ajuda-me a escrever.
É apresentada a janela Melhorar o meu comando.
Na caixa Comando atual, escreva o seu comando e, de seguida, clique em Melhorar.
O comando reescrito é apresentado na caixa Comando melhorado. Pode editar o comando melhorado ou usá-lo tal como é apresentado.
Clique em Inserir para usar o comando apresentado.
O comando é inserido na caixa Escreva o seu comando.
Clique em
Gerar.
REST
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- PROJECT_ID: o seu Google Cloud ID do projeto.
- MODEL_VERSION: a versão do modelo de geração de imagens a usar.
Para mais informações sobre as versões e as funcionalidades dos modelos, consulte o artigo Versões dos modelos.
- LOCATION: a região do seu projeto. Por exemplo,
us-central1
,europe-west2
ouasia-northeast3
. Para ver uma lista das regiões disponíveis, consulte Localizações da IA generativa na Vertex AI. - TEXT_PROMPT: o comando de texto que orienta as imagens que o modelo gera. Antes de as imagens serem geradas, este comando base é melhorado com mais detalhes e linguagem descritiva através da ferramenta de reescrita de comandos baseada em GMLs.
-
IMAGE_COUNT: um número inteiro que descreve o número de imagens a gerar. Os valores aceites são
1
-4
. O valor predefinido é4
. -
PROMPT_SETTING: um valor booleano.
true
ativa os comandos melhorados efalse
desativa-os. O valor predefinido étrue
.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict
Corpo JSON do pedido:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "sampleCount": IMAGE_COUNT, "enhancePrompt": PROMPT_SETTING } }
Para enviar o seu pedido, escolha uma destas opções:
curl
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"
PowerShell
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
prompt
adicional que mostra o comando melhorado e a imagem gerada associada:
{ "predictions": [ { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_1", "bytesBase64Encoded": "BASE64_IMG_BYTES_1" }, { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_2", "bytesBase64Encoded": "BASE64_IMG_BYTES_2" } ] }
Por exemplo, a seguinte resposta de exemplo destina-se a um pedido com
"sampleCount": 2
e "prompt": "A raccoon wearing formal
clothes, wearing a top hat. Oil painting in the style of Vincent Van
Gogh."
. A resposta devolve dois objetos de previsão, cada um com o respetivo comando melhorado e os bytes da imagem gerada codificados em base64.
{ "predictions": [ { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh, depicting a raccoon adorned in a finely tailored tuxedo, complete with a crisp white shirt and a bow tie. The raccoon also sports a classic top hat, perched jauntily on its head. The painting uses thick, swirling brushstrokes characteristic of van Gogh, with vibrant hues of blue, yellow, and green in the background, contrasting with the dark tones of the raccoon's attire. The light source is subtly placed, casting a dramatic shadow of the raccoon's attire onto the surface it sits upon, further enhancing the depth and dimensionality of the composition. The overall impression is one of a whimsical and sophisticated character, a raccoon elevated to a higher class through its formal attire, rendered in van Gogh's iconic style.", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh featuring a raccoon in a dapper suit, complete with a black jacket, crisp white shirt, and a black bow tie. The raccoon is wearing a black top hat, adding a touch of elegance to its ensemble. The painting is rendered with characteristic van Gogh brushwork, utilizing thick, impasto strokes of color. The background is a swirl of blues, greens, and yellows, creating a vibrant yet slightly chaotic atmosphere that contrasts with the raccoon's formal attire. The lighting is dramatic, casting sharp shadows and highlighting the textures of the fabric and the raccoon's fur, enhancing the sense of realism within the fantastical scene. The composition focuses on the raccoon's proud posture, highlighting the whimsical contrast of a wild animal dressed in formal attire, captured in the unique artistic language of van Gogh. ", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
O que se segue?
- Defina o idioma do comando de texto
- Configure o formato
- Omitir conteúdo com um comando negativo
- Gere imagens determinísticas