Gemini 2.5 Flash

O Gemini 2.5 Flash é o nosso melhor modelo em termos de preço e desempenho, e oferece capacidades abrangentes. O Gemini 2.5 Flash é o nosso primeiro modelo Flash com capacidades de raciocínio, que lhe permite ver o processo de raciocínio pelo qual o modelo passa quando gera a sua resposta.

Para informações técnicas ainda mais detalhadas sobre o Gemini 2.5 Flash (como referências de desempenho, informações sobre os nossos conjuntos de dados de preparação, esforços em sustentabilidade, utilização e limitações pretendidas, e a nossa abordagem à ética e segurança), consulte o nosso relatório técnico sobre os nossos modelos Gemini 2.5 e o cartão do modelo do Gemini 2.5 Flash.

2.5 Flash

Experimentar na Vertex AI Ver no Model Garden (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.
ID do modelo gemini-2.5-flash
Entradas e saídas suportadas
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo
  • Resultados:
    Texto
Limites de tokens
  • Número máximo de tokens de entrada: 1 048 576
  • Tokens de saída máximos: 65 535 (predefinição)
Capacidades
Tipos de utilização
Limite de tamanho da entrada 500 MB
Especificações técnicas
Imagens
  • Número máximo de imagens por comando: 3000
  • Tamanho máximo da imagem: 7 MB
  • Tipos MIME suportados:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de ficheiros por comando: 3000
  • Número máximo de páginas por ficheiro: 1000
  • Tamanho máximo do ficheiro por ficheiro para as importações da API ou do Google Cloud Storage: 50 MB
  • Tamanho máximo do ficheiro por ficheiro para carregamentos diretos através da consola: 7 MB
  • Tipos MIME suportados:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com ��udio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Tipos MIME suportados:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de ficheiros de áudio por comando: 1
  • Compreensão da fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME suportados:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

(Inclui a quota partilhada dinâmica e o débito aprovisionado)

  • Global
    • Global
  • Estados Unidos
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8

Processamento de ML

  • Estados Unidos
    • Multirregião
  • Canadá
    • northamerica-northeast1+
  • Europa
    • Multirregião
    • europe-west2* +
    • europe-west3* +
    • europe-west9* +
  • Ásia-Pacífico
    • asia-northeast1* +
    • asia-northeast3* +
    • asia-south1* +
    • asia-southeast1+
    • australia-southeast1* +
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Janeiro de 2025
Versões
  • gemini-2.5-flash
    • Fase de lançamento: GA
    • Data de lançamento: 17 de junho de 2025
    • Data de descontinuação: 17 de junho de 2026
  • gemini-live-2.5-flash
    • Fase de lançamento: GA privado
    • Data de lançamento: 17 de junho de 2025
Controlos de segurança
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.
+ O ajuste fino supervisionado não é suportado
* Disponível apenas para a janela de contexto de 128 K. O ajuste fino supervisionado não é suportado

2.5 Flash

Experimentar no Vertex AI (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.
ID do modelo gemini-2.5-flash-preview-09-2025
Entradas e saídas suportadas
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo
  • Resultados:
    Texto
Limites de tokens
  • Número máximo de tokens de entrada: 1 048 576
  • Tokens de saída máximos: 65 535 (predefinição)
Capacidades
Tipos de utilização
Especificações técnicas
Imagens
  • Número máximo de imagens por comando: 3000
  • Tamanho máximo da imagem: 7 MB
  • Tipos MIME suportados:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de ficheiros por comando: 3000
  • Número máximo de páginas por ficheiro: 1000
  • Tamanho máximo do ficheiro por ficheiro para as importações da API ou do Google Cloud Storage: 50 MB
  • Tamanho máximo do ficheiro por ficheiro para carregamentos diretos através da consola: 7 MB
  • Tipos MIME suportados:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Tipos MIME suportados:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de ficheiros de áudio por comando: 1
  • Compreensão da fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME suportados:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

(Inclui a quota partilhada dinâmica e o débito aprovisionado)

  • Global
    • Global
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Janeiro de 2025
Versões
  • gemini-2.5-flash-preview-09-2025
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 25 de setembro de 2025
Controlos de segurança
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.

Imagem

Experimentar no Vertex AI (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.
ID do modelo gemini-2.5-flash-image-preview
Entradas e saídas suportadas
  • Entradas:
    Texto, Imagens
  • Resultados:
    Texto e imagem
Limites de tokens
  • Máximo de tokens de entrada: 32 768
  • Máximo de tokens de saída: 32 768
Capacidades
Tipos de utilização
Limite de tamanho da entrada 500 MB
Especificações técnicas
Imagens
  • Número máximo de imagens por comando: 3
  • Tamanho máximo da imagem: 7 MB
  • Número máximo de imagens de saída por comando: 10
  • Tipos MIME suportados:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de ficheiros por comando: 3
  • Número máximo de páginas por ficheiro: 3
  • Tamanho máximo do ficheiro por ficheiro: 50 MB
  • Tipos MIME suportados:
    application/pdf, text/plain
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

(Inclui a quota partilhada dinâmica e o débito aprovisionado)

  • Global
    • Global
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Junho de 2025
Versões
  • gemini-2.5-flash-image-preview
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 26 de agosto de 2025
Controlos de segurança
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.

Áudio nativo da API Live

Gemini 2.5 Flash com funcionalidades de áudio nativas da API Live a nossa funcionalidade de áudio nativa de vanguarda para a API Live. Além das funcionalidades padrão da API Live, este modelo de pré-visualização inclui:

  • Qualidade de áudio melhorada: desfrute de uma qualidade de áudio significativamente melhorada que lhe dá a sensação de estar a falar com uma pessoa.
  • Qualidade de voz e adaptabilidade melhoradas: o áudio nativo da API Live oferece interações de voz mais ricas e naturais com 30 vozes HD em 24 idiomas.
  • Apresentamos o áudio proativo: Quando o áudio proativo está ativado, o modelo só responde quando é relevante. O modelo gera transcrições de texto e respostas de áudio proativamente apenas para consultas dirigidas ao dispositivo e não responde a consultas não dirigidas ao dispositivo.
  • Apresentamos o diálogo afetivo: os modelos que usam o áudio nativo da API Live podem compreender e responder adequadamente às expressões emocionais dos utilizadores para conversas mais detalhadas.
  • Interrupção melhorada: interrompa o Gemini de forma mais natural e fiável, mesmo em ambientes ruidosos.
  • Chamada de funções robusta: melhorámos a taxa de acionamento, o que permite ao Gemini executar com êxito as funções que define para suportar os seus exemplos de utilização.
  • Transcrição precisa: a precisão da transcrição de áudio para texto foi significativamente melhorada.
  • Suporte multilingue integrado: fale com o Gemini em vários idiomas, e este alterna facilmente entre eles sem qualquer pré-configuração. O idioma já não é uma barreira.

Para mais informações sobre a API Live, consulte:

Experimentar no Vertex AI

ID do modelo gemini-live-2.5-flash-preview-native-audio-09-2025
Entradas e saídas suportadas
  • Entradas:
    Texto, Áudio, Vídeo
  • Saídas:
    Texto, Áudio
Limites de tokens
  • Tokens de entrada máximos: 128 000
  • Tokens de saída máximos: 64 mil
  • Capacidade de resposta: 32 000 (predefinição), atualizável para 128 000
Capacidades
Tipos de utilização
Especificações técnicas
Vídeo
  • Resolução padrão: 768 x 768
  • Tipos MIME suportados:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima da conversa: Predefinição de 10 minutos que pode ser prolongada.
  • Formato de entrada de áudio obrigatório: Áudio PCM de 16 bits não processado a 16 kHz, little-endian
  • Formato de saída de áudio necessário: Áudio PCM de 16 bits não processado a 24 kHz, little-endian
  • Tipos MIME suportados:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Predefinições de parâmetros
  • Início da sensibilidade da voz: baixa
  • Sensibilidade ao fim da fala: elevada
  • Preenchimento de prefixo: 0
  • Tamanho máximo do contexto: 128 K
Regiões suportadas

Disponibilidade do modelo

  • Estados Unidos
    • us-central1
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Janeiro de 2025
Versões
  • gemini-live-2.5-flash-preview-native-audio-09-17
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 18 de setembro de 2025
  • gemini-live-2.5-flash-preview-native-audio
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 17 de junho de 2025
    • Data de descontinuação: 18 de outubro de 2025
Controlos de segurança
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.